专访第四范式戴文渊：澄清AI热潮背后的误解，向“无穷大”前进|ai|人工智能|戴文渊|无穷大|第四范式

每经记者：可杨每经编辑：张海妮

一部由史蒂文·斯皮尔伯格（Steven Spielberg）执导的电影《人工智能》，讲述的是一个小男孩最终发现自己是人工智能的故事。

人工智能什么时候才能达到这样的水平？难道人工智能的作用就是制造一个类人智能体吗？这是第四范式创始人、董事长戴文渊投身人工智能产业早期最令他迷惑的两个问题。

最终，他在图灵奖获得者詹姆斯·尼古拉·格雷（James Nicholas Gray，昵称Jim Gray）2007年《科学发展的四个范式》的演讲中找到答案。其中，第四范式阶段是指数据科学——随着数据爆发式增长以及技术演进，科学理论由计算机从海量数据中发现。

戴文渊所创立的人工智能公司“第四范式”的名字也由此而来。这家成立于2014年的企业级人工智能平台企业，迎着人工智能的潮起与潮落成长至今，作为掌舵者，戴文渊向《每日经济新闻》记者分享的心得是，不要太在乎AI（人工智能）是不是能做所有事，或者不能做所有事，因为这对于市场来说也不重要，客户关心的问题是：“我是卖鸡翅的，AI能做的所有的事情，跟我有什么关系？重要的是我的鸡翅能不能（通过AI）卖得更好。”

大模型时代，第四范式主张对模型进行“剪裁”，以求用最“经济”的方式做领先的AI。在戴文渊眼中，通用大模型和行业大模型是实现AGI的不同路径，区别在于是用一个模型去实现AGI，还是用很多模型去实现AGI。而两相比较之下，行业大模型是他认为最“经济”的方式。

热潮与误解一同翻涌，市场期望AI解决所有的问题

新的热浪翻涌在第四范式成立的第十年，这也促使戴文渊作出了一些改变。

2023年，很多人找到戴文渊，问他：“ChatGPT会怎么帮助到我的企业？”上一次他被问及类似的问题是在2016年，那时，问句的主语是AlphaGO。

更有趣的是，这一次，几乎所有的客户、投资人、媒体记者都在使用“技术的语言”来提问，“参数”成为高频词，与之前的状况大不相同。

戴文渊说：“要把AI做好，就先不要谈AI的问题，先谈谈公司是做什么的，把这些问题谈清楚，咱们再回头看看AI是不是可以（对公司）有帮助。”

市场和客户都对新技术感到兴奋时，戴文渊希望能借此机会引导一个正确的“AI价值观”：“不能先把参数做到一千亿，再想这千亿的参数到底能干什么？”

市场期望AI解决所有的问题，这反映了一种恐慌心理：万一AI能做但是自己没有用到，那可能会失去一些机会。戴文渊将此视为一个机遇，“担忧”打开了世人想要了解AI的窗子，但误解也同热潮一同翻涌，第四范式要做的，是把AI的价值带到众人面前。

ChatGPT，这个目前最火爆的大模型应用，将大模型带到了人工智能圈层以外的世界，热浪之下，一些人对于大模型的理解或许是：和ChatGPT一样的技术。

直至今天，市场中最受关注的大模型依旧是以大语言模型为主，即“预测下一个字”的模型，年初爆火的Sora则是“预测下一帧画面”的模型。

图片来源：视觉中国-VCG211481511997

但应用是更加实际的事，对于绝大多数企业而言，“预测下一个字”解决不了核心问题。例如，金融机构需要解决风控问题，但这不是语言问题；大语言模型可能会辅助金融机构解决客服事宜，但这可能不是它的核心问题。真正的行业大模型应当是针对不同场景，构建不同模态，去预测下一个“事情”。

这背后有一个更大的误解——很多人问，能不能基于开源大模型底座或GPT，训练行业需要的新模态模型。但即使同样出自OpenAI之手，要在GPT模型上直接精调出Sora，也是不可能的事情。

戴文渊介绍，大多数行业大模型是要基于特定业务所积累的特定模态的数据，训练出一个基座大模型，就像目前训练底座的大语言模型、视频模型一样。

其实，行业大模型这件事，其实已经发生了十年之久。2014年，第四范式推出人工智能平台——先知1.0，用建模型的方式，挖掘业务数据价值，提升业务效果。如今“先知”已经迭代到了5.0版本，定位于降门槛，让企业自行构建高价值场景所需的行业大模型，例如预测疾病风险、欺诈行为、灾害险情、设备故障等，打破大语言模型只能生成文字、图像、视频的局限。

信心不再是问题，但市场的耐心有限

1956年夏天，在达特茅斯学院举办了一场人工智能研讨会，主题研究“让机器能像人那样认知、思考和学习，即用计算机模拟人的智能”的科学。

这次会议被普遍视为人工智能技术的起点，由此出发，人工智能开始沿着一条波浪式的曲线前进，经历着巨大的潮起与潮落，穿梭在失望与希望之间。

两到三年，戴文渊认为这是市场能给一场技术热潮的最大耐心。

距离我们最近的一次潮起被认为来自2016年，基于强化学习算法的AlphaGo战胜人类围棋选手李世石，“机器是否会代替人类”在彼时引发市场关注，商汤科技、旷视科技等一批人工智能“独角兽”站到台前。

第四范式是一家幸运的公司，这家公司诞生于2014年，从诞生的第一天就开始做企业端的生意。不过那时候，很多企业告诉戴文渊，自己没有人工智能预算。随着AlphaGO成为那枚投向平静水面的石子，突然之间，所有的客户都找来问他：“你们是人工智能企业，你来给我讲一讲AlphaGO可以帮我做什么？”“我们有预算，我们要AlphaGO。”

两三年的时间，人们理想中的人工智能工具没有诞生，市场信心在2019年崩盘。据猎豹全球智库数据，与2018年相比，2019年中国人工智能企业的融资金额由1484.53亿元下降至967.27亿元，下降幅度达到34.8%，融资数量也由737个下降至431个，下降幅度达四成。

直到ChatGPT成为下一颗石子，这场“寒冬”结束，AI市场再度迎来热潮。

戴文渊认为，在2023年以前，市场对AI是信心问题；从2023年开始，不再是信心问题，而是要找到正确路径的问题。“不用担心客户认为AI没有用，需要解决的是，引导客户反过来想业务的问题。”戴文渊说。

潮起潮落，似乎已经成为人工智能行业的常态。潮为什么落，戴文渊认为和“价值”相关。2016年，每家企业都陷入“怎么去用AlphaGO帮助到我”的问题中，这个潮落了。今天也一样，如果每家企业想的都是“怎么用ChatGPT帮助到我”，可能这个潮也会落。

戴文渊判断，两三年内，如果大模型不能创造巨大价值，可能就会再度潮落，等待下一颗“石子”——或许是一个新的能够吸引眼球的东西，或许是能够在合理的投入产出中创造出足够价值的技术。

当下的机遇是市场的目光重新被吸引，但挑战同样在于，两到三年内能否兑现大模型的价值？

市场关注到人工智能“+”，戴文渊认为这个加号非常重要，这意味着，未来的两到三年，人工智能有可能可以去创造很大的价值，如果大家想的都是ChatGPT能不能帮到企业，可能不见得能创造市场预期的价值。

“以语言模型而言，去年主要的落地场景都与客服相关，如果在这么大的关注度之下，落地的应用全是问答类场景，可能两三年以后大家就失望了。”他说。

图片来源：视觉中国-VCG41N1472123004

AI是一个实验的过程，目标是提升“北极星指标”

目前来看，大模型赋能行业，依旧是一个充满前景的故事。每个行业都有人在做贡献，有人在的地方，AI就有发挥作用的机会——理论上不存在大模型无法赋能的行业，人效上可以充分发挥想象力。

目前，绝大多数企业的核心业务都由人来作决策，但人作决策时往往面临两个困境：水平参差不齐、精力有限。当AI能力提升，哪怕其能力尚未全面超越人类，即便仅达到人类的平均水平，但如果能复制很多“人”，就很有可能提供更好的业务价值。

企业招聘员工时，并非需要每个员工都达到顶尖水平，而是注重每个员工是否能为企业带来积极的贡献。因此，戴文渊认为，尽管第四范式的目标是使得AI的表现超越绝大多数业务专家，但从实践角度来看，AI即使仅仅达到专家平均的能力水平，也有可能为企业带来显著的价值提升。

从数字化时代开启到数智化时代来临，赋能传统企业与实体经济始终是市场对技术的期待。随着大模型来临，数字技术从传统的信息搜集、传输、整理、储存，逐渐走到辅助决策甚至替代决策阶段。

戴文渊指出，一些企业当前在使用AI时，依旧存在数字化时代的惯性思维，即过于依赖同行业的成功案例，试图直接移植成熟方案落地到本企业。但实际上AI和企业核心竞争力相关以后，不同企业的目标是不一样的。

这背后的根本原因在于，数字化时代，技术解决的不是核心业务问题，而是通过提升边缘问题的效率，进而让整个企业的效率提升，但是核心问题仍然是人在解决。进入AI时代，核心问题将交由机器学习，所以每家企业所定位的核心竞争力也不同，无法完全复制。

理想状态下，大模型应该能够帮助企业完成核心决策。为此，第四范式将企业的战略目标转化为计算机可以记录和跟踪的语言，即企业的“北极星指标”，以此作为企业最核心的关键指标。

戴文渊认为，对于企业而言，在使用AI前，需要先想明白一点：对于提升“北极星指标”，什么叫好，什么叫不好。以实体零售企业为例，其核心效率体现在每平方米所贡献的效益上，这可能就是一家零售企业的“北极星指标”。所有围绕这一指标的改进，都需要量化其对“北极星指标”的实际影响，无论是提升还是下降。

戴文渊强调，企业的“北极星指标”永远是正确目标的近似。因为方向总会发生偏移，需要及时调整后又前进。而定位的调整，需要企业的核心决策者来完成。他认为，企业有效使用大模型的核心是，一定要变成企业的“一把手”工程，因为“一把手”需要告诉AI什么是对的，什么是好的，否则转型很难成功——在人工智能的世界里，0和1是确定的。

而在实践中，AI的应用并不意味着每一步都能带来提升。

“AI其实是一个实验的过程。”戴文渊举例，假设有一百万的客户基础，可能将九十万作为基线，剩余的十万，每一万作为一个实验组，持续尝试模型的优化与迭代。“早期的实验基本上是成功的，每次实验都会比九十万更好。但是到了一定阶段绝大多数的实验都是失败的，也没有关系，往往到了一定的规模体量以后，一百次体验如果能成功一次，就能赚回前面九十九次失败的所有成本。”戴文渊说。

AI是一个实验的过程，这是戴文渊的认知，但尚未在客户中达成共识。

客户的认知提升是AI产业发展至关重要的一环。如果认知迟迟没有发生变化，AI会重新变成“需要有一个大模型、交付一个大模型，这个大模型的参数是不是一千亿，是一千亿就验收通过付款、结束”的过程，也许再经过一年半载，客户会觉得，大模型好像没什么用。

这时，热潮可能将会再度遗憾告终。

图片来源：视觉中国-VCG41N1307121233

AI是科学问题，AI应用是经济问题

在通往通用人工智能（AGI）的路上，通用大模型和行业大模型是两条不同的技术路线，戴文渊认为，大家都是朝着AGI的方向前进，区别在于是用一个模型去实现AGI，还是用很多模型去实现AGI。

在他看来，从架构角度、算力、能源成本而言，用一个模型去解决所有的问题，不是最经济的。

戴文渊还提出了一个更为少见的观点：并不存在真正的通用大模型，所谓的通用大模型，本质是将多种场景融入一个模型中。例如，通过收集网络上的广泛语料，并进行切分以支持不同垂直场景。优化通用大模型的过程，需要对其各项能力进行全面评估，一旦发现某项能力相对薄弱，再增加相关数据，以强化该能力。从某种程度上讲，这可以视为不同场景的组合。

而第四范式的做法是，进行剪裁，先做垂直的行业模型。如果模型仅针对某一特定场景进行应用，就先通过该场景的数据模态构建专用模型，同样参数量往往能实现更好的效果。相反，若模型被设计为一个通用大型模型，最后通用大模型应用到某一具体场景，往往很可能是不经济的。

戴文渊说：“比如我现在是人工智能的从业者，其实也是被剪裁的，我花了绝大多数的脑细胞去干AI，没有花心思去学习怎么写小说。如果我是一个全才，每个方面都很厉害，我去选择做AI就很屈才了。从经济角度说，一个被剪裁过的模型更好。”

“经济”，在一个小时的采访里，戴文渊至少5次提到这个词。“我们致力于把这个问题（解决），或者把这个技术做出来，如果我选择了不经济的一条路，可能最后我会做不出来，我们要综合考虑每一种方向，每一个路线所面临的问题，最后找到一个最有可能的解决方法。”戴文渊说。

“做最领先的AI是特别特别贵的事，需要花很多钱。”或许正因为如此，在技术信仰派和商业信仰派之争中，戴文渊认为自己处于两者之间。

AI显然是个科学问题，但做出最领先的AI技术，是个需要计算的经济问题。

戴文渊认为，经营一家AI技术公司，需要站在商业的角度思考问题：最领先的AI技术需要海量的算力和数据，如果不能和商业更好（地）结合，那么长期持续的资金投入将变得难以为继，“既需要技术又需要商业，如果你要做最好的东西，就必须要都有”。

此外，对于AI从业者的自我修养，戴文渊认为，还需要具备韧劲与恒心，“人工智能就是一个起起伏伏的赛道，可能这两年又被大家关注到了，甚至被吹上天，被吹上天的时候你不要觉得自己是神仙。同时，被踩到地下的时候，也不要觉得自己没有价值”。

波浪式前进的过程中，可以肯定的是，通往AGI的道路并没有一个标准的指路牌。

“AGI是我们所有人的理想，AGI就是我自己心目当中的一个无穷大。”戴文渊从来不认为AGI是一件三年、五年甚至十年就能实现的事，相反，他觉得，AGI是一件永远做不到，但永远都在做的事。他又补充道，可能在不久的将来所诞生的人工智能，在人类看来已经是AGI，判断的因素在于，“对于人来说，人工智能究竟是不是AGI，在于能不能发现它还有地方不会。如果发现不了，那这对人来说已经是AGI了”。