“AI版Office”年营收过亿，李开复：PMF已经过时了|ai|office|ppt|大模型|微软|投资者|李开复

文｜周鑫雨

编辑｜苏建勋

时隔半年，李开复再次以CEO的身份站在了大模型独角兽“零一万物”的发布会现场。

上一次李开复现身零一万物发布会现场，还是在2023年11月16日。彼时，零一万物首次秀了一把大模型肌肉：将中英双语大模型“Yi”开源。

李开复的出现，往往标志着零一万物新阶段的开启。显然，用开源模型打磨半年后，零一万物走进了拼产品和商业化的新战场。

在大模型侧，开源只能作为口碑获客的入口，商业化的飞轮只能靠闭源正式开启。发布会上，零一万物发布了首款千亿参数的闭源模型Yi-Large。在Benchmark上，Yi-Large的6项指标优于GPT-4。

不过，如今的零一万物将商业化的厚望，寄托在了产品端。

发布会上，零一万物正式对外推出AI生产力应用“万知”，李开复称其为“AI-First版Office”。这一款产品，在2023年九月已经在海外率先试水，在全球积累了数千万用户。

李开复表示，在AI生产力这个单一产品线上，今年能产生的营收可以达到1亿人民币。

如今，零一万物呈现在大众面前的业务版图，是开源+闭源、ToB+ToC、出海+本土两手抓的“双轨”。

业务的版图，折射的是李开复对技术信仰和市场落地“既要又要”的经营观。他认为，两方的观念都对，但并不完整。

在此基础上，他认为AI技术公司最重要的，是验证TC-PMF。T为技术，C为成本，PMF则是产品与市场需求的适配度。

在李开复看来，TC-PMF的反面教材，就是OfO这样的烧钱打法，产品、技术、成本相互脱节，并没有找到“黄金配比”。也正是为了验证TC-PMF，零一万物选择先在海外用高性能模型的API试水“万知”，时隔9个月后才在国内上线。

当然，作为零一万物的CEO，李开复也有了新的变化。为了跟上短视频时代的传播新趋势，这位“中国AI模型最高龄创业者”开通了抖音账号，科普怎么用AI。连这次的发布会，也选择在抖音上直播。

不过，李开复也有自己的坚持。比如，不做直播带货，只做AI科普。再比如，他也对投资人承诺，自己创业，“十年不套现”。

闭源模型6项指标超过GPT-4，成本仅后者1/3

2023年，零一万物切入大模型战局的方式是开源。自2023年11月6日以来，零一万物开源了6B、9B、34B三种尺寸的Yi大模型。

在本次发布会上，零一万物增强了开源模型的能力，同时首次发布了闭源模型Yi-Large。

Yi-Large是零一万物对标GPT-4所训练的千亿参数规模模型。在最新出炉的斯坦福评测机构AlpacaEval 2.0经官方认证的模型排行榜上，Yi-Large模型的英语能力主要指标LC Win Rate（控制回复的长度）仅次于GPT-4 Turbo。

在中文榜单SuperCLUE对中文能力的测评上，Yi-Large跻身国产模型的榜首，在多项选择题（GPQA）、人类对齐（AlignBench）等6项数据集的评测上超过GPT-4。

斯坦福评测机构AlpacaEval 2.0模型排行榜。

SuperCLUE排行榜。

与此同时，零一万物也开启了自己首个MoE（混合专家架构）大模型Yi-XLarge的训练。目前在MMLU、GPQA、HumanEval、MATH等权威Benchmark上，处于训练初期的Yi-XLarge，性能已经超过Yi-Large，并且与Claude-3-Opus、GPT4-0409等海外主流模型相比，已有上擂台的资格。

Yi-XLarge测评结果。

而在开源梯队上，零一万物将34B、9B、6B三款模型升级到了Yi-1.5版本，并提供了Base（预训练版）和Chat（微调版）两个版本。

1.5版本的Yi，主要在数学和代码的短板上下了功夫。经过微调后，Yi-1.5-6B/9B-Chat在GSM-8K和MATH等数学能力评测集、HumanEval和MBPP等代码能力评测集上，表现甚至优于Llama-3-8B。Yi-1.5-34B-Chat的代码能力则与Mistral-8x22B-Instruct-v0.1 持平。

在模型服务层面，零一万物发布了Yi-Large的6种不同尺寸、性能的模型API：