1024 程序员节模型与工具论坛回顾：大模型时代的“魔法武器”|sql|大模型|程序员|算法|魔法武器

出品 | CSDN（ID：CSDNnews）

10 月 25 日，第五届“长沙·中国 1024 程序员节”模型与工具论坛于世界计算·长沙智谷举办。论坛由北京智源人工智能研究院数据研究组负责人刘广担任出品人，来自智源人工智能研究院、华为、合合信息、蚂蚁集团、墨奇数据、InterSystems 中国等的技术专家发表主题演讲与分享，通过工具学习架起语言模型和实际应用之间的桥梁。

Infinity-MM：驱动开源模型迈向 SOTA 性能

在《千万级多模态指令数据集 Infinity-MM：驱动开源模型迈向 SOTA 性能》的主题分享中，北京智源人工智能研究院数据研究组资深算法专家谷舒豪指出，由于缺乏数千万数据规模的高质量开源数据集，开源数据训练模型和性能距离 SOTA 仍有差距，开源指令数据集合规模和质量还有极大的提升空间。因此，智源研究院构建了千万级多模态质量数据集 Infinity-MM。通过收集和过滤现有开源多模态指令数据，使指令数据规模扩展到数千万级别，成为 SOTA 模型的数据基石。同时，使用数据合成技术，针对模型弱项，大规模合成高质量数据，减小开源模型和闭源模型之间的性能差距。

TextIn：智能文档处理“百宝箱”

在 RAG、Agent、DP 或文档相关开发任务落地时，开发者或许常常会遇到诸如文档内容解析出错、解析速度慢、CornerCase 太多等问题。基于此，作为在智能文档处理领域深研多年的一员，合合信息智能创新事业部研发总监常扬带来《智能文档处理“百宝箱”，加速文档类应用研发》的主题分享。常扬着重强调了“智能文档处理百宝箱”的三大全新工具。可视化文档解析前端 Textln ParseX 前端组件以其多种扫描内容支持、多语言兼容性、卓越的表格识别能力等优势，能够提供丰富的文档可视化和交互功能，方便审核校对；向量化 acge-embedding 模型是一种高精度的文本向量化模型，它以海量的文本数据转化向量，极大提升了长文档信息检索精度，解决大模型“幻觉”问题；文档解析测评工具 markdown tester 能够针对表格、段落、标题、阅读顺序等关键指标进行定量测评并评估文档解析效果，节省筛选产品时间。

muAgent：由知识图谱引擎驱动的创新 Agent 框架

此次论坛上，蚂蚁集团高级算法专家蒋炜以《智能画布 muAgent，全新体验 Agent 框架》为主题，讲述蚂蚁CodeFuse团队开发的Multi-Agent框架muAgent的整体框架和技术实现。蒋炜指出，站在当前视角，模型可解单步骤简易任务、单步骤工具使用，但实际现实中的场景是复杂多步骤的，尤其面向专业领域，LLM 只能给出泛泛而谈的任务规划决策（包括 ChatGPT），因此就需要 Agent 来解决实际问题。muAgent 包含 Planner、Memory 和 ActionSpace 三大核心模块，可满足多种通用场景的交互使用，具有复杂推理、知识即用、人工交互、在线协同等多诸多技术优势。

MyScale：SQL 与向量融合的新范式

墨奇科技开发了基于 ClickHouse 构建的开源 SQL 向量数据库——MyScale。在《SQL与向量融合的新范式，高性能向量数据库 MyScale》的分享中，墨奇数据 CTO &联合创始人汤林鹏指出，MyScale 通过将 SQL 数据库/数据仓库、向量数据库和全文搜索引擎的功能集成到一个高效的系统中，显著降低了基础设施和维护成本。这种统一不仅促进了联合数据查询和分析，还建立了一个对所有 AI 应用至关重要的强大而多功能的数据基础。

“IDE + RAG”：构建可信的编码智能体

在《Code Model based RAG for Code》的主题分享中，华为 CodeArts IDE 技术专家 Volkov Mikhai 认为，当前全球顶尖的 IDE 开发商都在努力尝试将 AI 工具插入 IDE，尽管市场上已经涌现出诸多解决方案，但这些方案的功能尚显有限，且往往依赖于难以获取的强大计算能力。因此，Volkov Mikhai 及其团队经过大量的试验以及场景验证，通过使用高质量模型将问题描述成自然语言与关键信息、使用 RAG（检索增强生成）技术进行代码搜索、使用长上下文模型对检索后的代码进行分析与解释等方式，在 IDE 中结合 RAG 编排，从而构建可信的编码智能体。

InterSystems IRIS：实现医疗数据解决方案价值的最快途径

在《RAG 在医疗行业的应用》主题分享中，InterSystems 中国 AI 领域工程师刘皆良指出，InterSystems IRIS 数据平台集事务型数据库、分析型数据库、矢量数据库、文档数据库等于一身，是单一架构的数据平台。在演讲中，刘皆良讲解了 IRIS 向量查存储和查询方式、内建接口适配器、数据转换建模、端到端管理等内容，帮助观众更好地理解 IRIS 的整体架构。针对重要的关于 PHI（Protected Health Information）患者敏感信息问题，InterSystems IRIS 数据平台利用 Prompt 工程，通过与 LLM 提供商协定关于敏感数据的使用问题、对于关键信息进行匿名化处理、使用私有部署的 LLM 模型等方式达成了更好的处理效果。

结语

人脑能够灵活运用工具，标志着人类智能的一大进步，机器模仿人脑习得工具使用的机制，想必也能带来人工智能的质的飞跃。随着模型规模的持续增长和算力成本的不断下降，相信语言模型与工具学习必将得到更广泛的应用。至此，第五届“长沙·中国 1024 程序员节”模型与工具论坛圆满落幕，让我们共同期待 AI 模型与工具在未来碰撞出更加灿烂的火花！