2025年世界人工智能大会(WAIC)正在上海举行,大模型在专业领域的应用成为业界关注焦点之一。7月27日下午的“从通用智力到专业生产力:高阶程序引领的AI应用新范式”论坛上,蚂蚁集团旗下蚂蚁密算宣布对外开源高阶程序(High-Order Program)大模型可信应用技术框架,探索智能与工程融合的AI应用新范式,致力解决大模型在专业应用中的可靠性困境,推动大模型在专业领域中规模化应用。
论坛上,浙江大学教授、区块链与数据安全全国重点实验室主任陈纯表示,大模型的专业化应用,首当其冲的是可靠性问题。尽管当前技术SOTA已经到了80%到90%的水平,但其可靠性距离医疗、工业、金融等专业场景的要求仍有显著差距。陈纯说,有人将这一问题简单归结为“幻觉”,但我想强调:幻觉是智力的必然代价。若消除所有幻觉,大模型将退化为机械的检索工具。因此,可靠性的突破不在于消灭“智力特征”,而在于构建工程化保障框架。
对此,蚂蚁密算正在探索高阶程序(High-Order Program)大模型可信应用技术框架,核心组件包括业务逻辑的程序化表达、场景知识图谱和受控工具链,在全流程中贯穿核验机制,对关键执行结果进行及时、有效地核验和处理。该框架借鉴了人类在工程管理体系中的成功经验,如通过标准作业程序(SOP)和检查清单等机制,构建一个能够有效复用、验证、扩展和派生的机制,使大模型在应用过程中即使出现幻觉问题,也能保证大模型达到专业领域所需的精确性和可靠性。
以金融联合风控为例,在传统金融风控体系下,从数据探查、处理到模型构建与调优的全链路操作,高度依赖人工干预,导致流程冗长、响应缓慢,并且容易受人员主观因素影响,制约了金融风控联合建模的效率与一致性。在应用HOP技术框架后,将复杂的SOP转化为可执行的流程和代码,实现风控全链路的智能化编排与自动化执行。相较于传统建模人员手动进行数据分析和代码开发,大模型结合HOP能够在确保高精度的同时缩短建模周期,并显著减少了重复性数据处理和流程执行等繁琐的基础工作。这不但能降低处理成本,还能够缓解专业人才紧缺的局面。
韦韬表示,高阶程序可以与大模型强互补,将大模型这样的通用智力引擎,可靠地应用于众多专业场景。“大模型可靠性的解法,不在于大模型本身,而在于工程化和智能化的融合。我们开源高阶程序HOP,希望与行业一起把大模型从人类助手正在变成规模化专业生产力。我们也相信,解决了可靠性问题,大模型即将涌现新的Killer App(杀手级应用)。”
热门跟贴