预训练停摆，有一半大模型企业去做应用了？|ai|大模型|机器人|李开复|模型企业|百川|预训练

自年初以来，AI应用层的井喷被业界寄予厚望，成为今年AI领域的最强看点。

近日有传闻指出，“大模型六小虎”（包括智谱、MiniMax、百川智能、零一万物、阶跃星辰、月之暗面）中的百川智能与零一万物已经停止了大型模型的预训练工作。

针对这一传闻，两家公司迅速做出了回应，均予以否认。

百川智能方面坚决否认了停止预训练的说法，强调其预训练团队稳定，相关工作正在有序且持续地推进中，从未有过放弃预训练的打算。

零一万物的创始人李开复在10月11日晚通过朋友圈明确表示，零一万物一直在持续进行预训练工作。他提到，公司去年及今年发布的Yi-34B、Yi-Large、Yi-Coder、Yi-VL、Yi-Vision模型，在发布时均已达到全球领先的预训练模型水平。

来源：李开复朋友圈

今天上午，零一万物召开媒体线上发布会，正式发布了新旗舰模型Yi-Lightning。

在发布会上，李开复还表示，“六小虎”拥有充足的融资金额，只要有人才就会持续进行预训练。他强调，打造优质的预训练模型是一项技术密集型任务，需要一支强大的团队来支撑。

辟谣的背后

尽管两家公司均对传闻进行了否认，但传言的流传并非毫无根据。据经济观察报统计，截至2024年10月9日，已有188项生成式人工智能服务大模型通过网信办的备案，意味着这些大模型已具备上线提供服务的资格。然而，在这些备案的大模型中，超过三成在通过备案后并未进一步公开其进展情况；仅有约一成的大模型仍在持续加速模型训练；而接近一半的大模型则选择将重心转向AI应用的开发。

预训练（pre-train）作为AI大模型的基础教育阶段，对于模型的性能提升具有至关重要的作用。通过预训练，模型可以学习到海量而通用的知识，为后续的任务打下坚实的基础。然而，预训练也面临着高昂的算力成本和复杂的训练过程等挑战。

随着第三方预训练模型性能的提升，应用层企业开始面临一个选择：是继续投入高昂的算力成本进行预训练，还是专注于后训练环节，以节省成本并快速推出应用？

在这一背景下，大模型“六小虎”展现出了各异的现状和发展策略。

智谱AI推出的AI搜索智能体支持深度阅读和多级推理，同时在B端市场发力，为大型企事业单位提供解决方案。

百川智能则在医疗领域取得了进展，与北京儿童医院等医疗机构合作推出了儿童健康大模型，并在智能客服和内容创作领域也有所涉猎。

在今日的发布会上，零一万物公司首次公开了其向TO B端业务拓展的计划，此前公司一直专注于C端市场，视C端应用为模型变现的核心。此次，零一万物推出了全新ToB战略下的首款行业应用产品——AI 2.0数字人，该产品特别针对零售和电商等场景设计，将公司最先进的旗舰模型Yi Lightning融入具体行业解决方案中。

李开复强调了数字人技术的重要性，并指出，从事大模型应用的公司必须洞察并满足用户的完整需求，构建一个全面的产业链。

他提到，目前真正盈利的只有芯片公司，但应用层面的公司还在探索盈利的路径。一个成功的APP，需要依赖成本如同“白菜价”般亲民的大模型。如果模型价格高昂，将会阻碍优质模型的涌现与发展。零一万物公司表示，他们不会涉足无利可图的TO B业务，认为可持续的收费模式才是理想的商业模式。

月之暗面推出的Kimi主打长文本处理能力，并在10月12日上线了具备AI自主搜索能力的探索版。据月之暗面内部消息透露，公司早在年初便已着手于文生视频领域的研发工作。

MiniMax和阶跃星辰也在各自的领域取得了不错的成绩。MiniMax推出了海螺AI和星野等产品，专注于虚拟社交和智能模拟领域。阶跃星辰则推出了C端产品跃问和冒泡鸭，并正在研发万亿参数MoE语言大模型。

模型落地比模型本身更重要

面对算力成本飙升与模型变现路径不明确的双重挑战，部分企业开始深刻反思自身的核心竞争力与资源分配。

在这种背景下，一些企业选择了战略调整，放弃直接参与预训练，而是将重心转移至后训练阶段与应用开发上。这一趋势在Character.AI的决策中得到了明显体现，该公司于2024年8月宣布放弃自行预训练，转而与第三方模型合作，以便集中资源于后训练流程和产品创新。

对于众多尚未盈利的初创AI公司而言，持续投入于模型参数的扩充与训练无疑是一项沉重的负担。因此，国内的一些模型供应商开始利用其在“数据+应用场景”上的优势，全力推进AI应用落地，力求打造出具有市场竞争力的“爆款”产品。

例如，钉钉推出了AI魔法棒，通过自然语言对话调用AI应用，解决了行业用户的痛点，提升了业务流转效率和生产力效率。出门问问则基于自研的通用大模型推出了“魔音工坊”AI配音平台，降低了配音创作门槛。

在营销与广告领域，AI技术的应用也取得了显著成效。快手通过AI脚本生成、智能高光切片以及全模态检索大模型，帮助客户实现了AI自动生成营销视频，提升了营销转化率，降低了获客成本。蓝色光标则将AI引入到全工作流程，创造了多个AI营销案例，实现了AI驱动的收入显著增长。百度文库作为国内早期接入生成式AI能力的产品，已逐步演进为“一站式AI内容获取和创作平台”。

在这一过程中，规模化的AI应用逐渐取代了单纯的模型性能优势，成为衡量模型供应商市场竞争力的重要标尺。用户数据的积累与运用，也随之成为模型供应商必须高度重视的核心要素。

放弃预训练，虽看似是对技术前沿的一种妥协，但在当前资金与算力紧张的环境下，却也是AI企业为了生存而做出的理性选择。这种转变，标志着在追求通用人工智能（AGI）的长远目标之前，AI公司更加务实地选择了先确保自身的存续与发展。

这一趋势也暴露了AI技术领域的泡沫现象。随着泡沫的逐渐消散，不少企业开始重新评估自身的技术能力与实际资源。商汤科技，作为AI行业的领军企业之一，在2018至2022的五年内累计亏损额达到438亿元。尽管其在智慧商业和智慧城市等领域有一定的营收，但面对高额的研发成本和激烈的市场竞争，商汤科技的盈利压力巨大。

在2022年底至2023年初成立的AI企业，它们在大模型热潮中纷纷涌现。然而，随着市场竞争的加剧和技术的瓶颈，这些企业发现自身难以快速实现盈利。其中，有些企业因资金链断裂而不得不选择注销或停业。据中国科技媒体报道，自人工智能（AI）聊天机器人ChatGPT在2022年发布到今年7月29日，中国刚注册成立不久、却又因成本等压力而处于注销、停业状态的AI企业近8万家。

众多企业意识到模型变现能力的不足，导致它们的现金流几乎完全依赖于外部融资及能快速实现产品市场契合（PMF）的AI应用。这无疑加剧了技术瓶颈期下大模型厂商的生存困境。

尽管如此，那些选择放弃预训练的企业仍然抓住了AI应用领域的盈利机遇。它们通过推出面向C端或B端的应用产品，努力在激烈的市场竞争中占据一席之地。例如，科大讯飞在AI领域深耕多年，其研发的讯飞AI翻译机就是一款面向大众消费人群的AI产品。该产品一经推出，就在国内外智能语音产品市场引发了不小的轰动，为科大讯飞带来了可观的营收。深兰科技在养老机器人领域有着深厚的积累，其研发的兰宝轮腿家用AI机器人是一款面向C端用户的居家养老前沿数字化AI产品。该产品兼具腿式的灵活性和轮式的机动性，具备多样性的运动形态，受到了市场的好评。

在这场AI的激烈角逐中，最终胜出的关键或许并不在于技术本身的先进性，而在于谁能更精准地将技术融入实际应用场景，满足用户的真实需求，创造出实实在在的价值。

每款产品的优势，来源于其背后公司所能积累的数据资源。大模型公司最后还能拼的是什么？