GPT狂飙,AI投资突进,整个创投市场都因人工智能而发烫。

稀缺的公司分分钟变身独角兽,新的挑战者接连入局, AI竞赛日趋白热化,中国“大模型”的“诸神之战”已经打响。

今年2月,美团联合创始人王慧文的一则“AI英雄榜”,高调入局“剑指”大模型。紧接着,前搜狗CEO王小川、前京东AI掌门人周伯文、被誉为“AI框架领域第一华人”的阿里技术副总裁贾扬清等一众大佬争先加入AI创业队伍。

更有众多背景华丽的初创团队涌现。比如,清华唐杰教授的智谱AI,黄民烈教授的聆心智能,循环智能杨植麟……都被头部VC赋予了颠覆行业的希望,创业的列车再次提速。

科技媒体The Information盘点了中国AI初创企业Top 5,究竟谁会是中国的OpenAI?

1.MiniMax

融资信息:天使轮

成立日期:2021-11-03

所属地:上海市

所属企业:名之梦(上海)科技有限公司

由前商汤科技副总裁、通用智能技术负责人闫俊杰成立的AI公司,已经构建了文本到视觉、文本到语音、文本到文本三大模态的基础模型架构,也是在当前的AI大模型创业潮中估值最高的创业公司

6月1日,据路透社报道,MiniMax已完成了超2.5亿美元新一轮融资,目前公司估值超12亿美元。在本轮融资中,有腾讯有关联的实体参与,参投资金或为4000万美元。

此前,MiniMax已完成两轮融资,投资方包括米哈游、IDG资本、高瓴创投、云启资本、明势资本等。云启资本曾在4月份发文确认,该机构于2021年投资MiniMax,是天使轮中唯一的早期投资机构。

今年2月16日,MiniMax在北京举办的小型媒体沟通会上曾透露,团队人数已过百,公司核心技术研发成员均来自全球知名高校和全球顶尖科技公司,拥有世界顶尖自然语言处理、语音、计算机视觉、计算机图形学等工业界和学术界经验,1/3的团队成员拥有世界顶尖技术实验室的博士学位。

据介绍,MiniMax直接从底层的基础模型做起,自研了三个foundation model(基础模型)——文本到视觉(text to visual)、 文本到语音(text to audio ),文本到文本( text to text)。

2.Langboat澜舟科技

融资信息:Pre-A+轮

成立日期:2021-06-10

所属地:北京市

所属企业:北京澜舟科技有限公司

打开网易新闻 查看精彩图片

澜舟科技的创始人周明是在国内AI市场温度降到谷底的时刻决定创业的。

2020 年底,周明考虑辞去微软亚洲研究院副院长的工作,很多朋友劝他别出来,但他很坚定地要开始大模型创业,认为 “大模型未来会成为某种基础设施”

周明于2021年正式成立澜舟科技,并成为了李开复的创新工场从0孵化的AI企业。周明曾指出,澜舟科技致力于解决人类的语言理解和生成难题,提供基于NLP(自然语言理解)技术的开源大模型以及聚焦于营销、金融、文化创意等场景的功能引擎和应用。

主要产品是基于“孟子大模型”核心技术打造的一系列能力平台和垂直场景应用。已落地孟子大模型、AIGC(智能创作)平台、机器翻译平台、金融NLP平台等多款技术及产品,落地同花顺、华夏基金等企业。结合类ChatGPT技术,澜舟科技推出了对话机器人MChat,能够通过智能对话帮助用户完成特定场景中的多种工作任务。

今年3月,澜舟科技完成了Pre-A+轮融资。本轮融资由北京中关村科学城公司领投,斯道资本和创新工场跟投。不到一年时间内,澜舟科技融资总额达到了数亿元。

在3月14日由创新工场举办的“AI1.0到 AI2.0的新机遇”趋势分享会上,澜舟科技正式发布了“类ChatGPT”的语言生成模型——孟子MChat可控大模型。

打开网易新闻 查看精彩图片

孟子MChat可控大模型强调了其本身“可控”的特色——模型能力相较于其他同类技术更为灵活,面向垂直领域、专业赛道落地会更加聚焦,可以根据行业、地域等需求做出快速调整。据周明介绍,孟子MChat可控大模型有以下几个特点:

将陆续推出10B和100B参数级的大模型;
具备聊天、问答、翻译、文本生成、信息抽取等多种能力;
可融合搜索结果、领域数据和知识图谱;
对功能、风格、人类认知等方面具可控性。

谈及对产业未来方向的展望,周明坦言,当下类ChatGPT技术在推理、逻辑、数学和算术、事实性错误等方面仍有所欠缺。未来,大模型相关的九大问题尤其值得关注,涉及推理能力、事实正确性、中文处理能力等方面。

3.智谱AI

融资信息:B轮

成立日期:2019-06-11

所属地:北京市

所属企业:北京智谱华章科技有限公司

打开网易新闻 查看精彩图片

智谱AI由清华大学计算机系唐杰教授创立,团队核心成员曾参与清华大学与智源研究院合作项目"悟道"的研发工作。2022年8月,清华大学知识工程实验室与智谱AI合作研发的超大规模预训练语言模型GLM-130B正式上线,是同年亚洲唯一入选斯坦福评测的全球主流大模型。

GLM在准确性等关键指标与OpenAI、谷歌大脑和Meta等公司的大模型对比中,仍旧表现非常出色,在MMLU、LAMBADA、BIG-bench-lite指标测试上超过了GPT-3、谷歌的PaLM和Meta的OPT大模型。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

今年5月16日,三六零宣布与智谱AI达成战略合作,双方共同研发的千亿级大模型“360GLM”,双方将参考“微软+OpenAI”的合作模式,将大模型与应用场景结合。

打开网易新闻 查看精彩图片

三六零CEO周鸿祎认为,国内应当建立大型科技企业 + 重点科研机构的产研协同创新模式,打造中国的“微软 +OpenAI ”组合引领大模型技术攻关。他表示,此次与智谱 AI 合作,正是借鉴了这种产研协同关系。

对于此次合作,智谱AI CEO张鹏表示,智谱AI一直坚持着自己的愿景,让机器像人一样思考,实现Model as a Service(MaaS)的理念。

打开网易新闻 查看精彩图片

目前,该模型的训练数据量为4000亿,中英文各占一半,拥有1300亿参数,训练成本在百万-千万人民币。截至到今年5月1日,该模型已经收到 69 个国家 1000 多个研究机构的下载使用申请。

在GLM-130B的基础上,智谱AI又进行了有监督的微调得到ChatGLM模型。ChatGLM模型是目前国内最先进的开源大模型,并已开放内测。

周鸿祎的微软梦能实现吗?智谱AI能成为中国的下一个OpenAI?

4.光年之外

融资信息:天使+

成立日期:2023年

所属地:北京市

美团联合创始人王慧文再创业的AI创业公司——光年之外,含着“金汤匙”出生一直备受关注。

2月,王慧文、出门问问创始人李志飞,以及真格基金两位合伙人戴雨森、刘元吃了顿饭。四人亲眼见到ChatGPT带来的变革,王慧文的态度是“必须参与”。

聊到兴起处,王慧文拿起手机,高调宣布了自己入局的态度:

自带5000万美元入局ChatGPT热潮,希望加入合适的公司。

打开网易新闻 查看精彩图片

两天后对外披露更多创业细节时,王慧文的想法显然已经从“求组队”变成了“我组局”

这位光杆司令在宣布招募“顶级技术人才”的同时豪言表示,各位放心施展才华,杂事交给他来打理,更是不必为资金担心——

除了他个人按照2亿美元估值出资的5000万美元,“下轮融资已经有VC认购2.3亿美元”

打开网易新闻 查看精彩图片

此后,王慧文陆续发文,招聘产品经理、算法工程师、实习生等。

打开网易新闻 查看精彩图片

进入3月,第二位投资光年之外的“大佬”出现了——王慧文的老友,美团创始人王兴

这位美团大佬加入队伍的方式是“出钱”,参与A轮投资,并出任光年之外的董事。王兴与王慧文是清华大学的同学兼室友,曾数度合作创业,一起打造了校内网、美团等多个大众熟悉的品牌。

再次并肩作战,王兴在票圈简单解释了背后的缘由:

AI大模型让我既兴奋于即将创造出来的巨大生产力,又忧虑它未来对整个世界的冲击。老王和在创业路上同行近二十年,既然他决心拥抱这次大浪潮,那我必须支持。

打开网易新闻 查看精彩图片

4月6日,光年之外的运营正式开始,王慧文在朋友圈更新了动态。

打开网易新闻 查看精彩图片

美团“双王”的招牌,也让“光年之外”在风投市场上吸纳资金变得更容易。毕竟,风投机构们应该也想抓住“再造美团”的机会。

王兴、王慧文带着美团,挺过了千团大战、百团大战,但历时九年才首次实现全年盈利。这一次,他们还能挺到ChatGPT版“美团”诞生吗?

5.杨植麟

在这场白热化的大模型“军备竞赛”中,不乏履历光鲜的90后创业者出现,Information提到了循环智能联合创始人杨植麟。

打开网易新闻 查看精彩图片

杨植麟本科就读于清华大学计算机系,师从智谱AI创始人唐杰,2015 年以年级第一名的优异成绩毕业。随后,赴自然语言处理(NLP)研究全球排名第一的卡内基梅隆大学语言技术研究所(LTI)攻读博士,师从苹果AI研究负责人 Ruslan Salakhutdinov和谷歌首席科学家William Cohen,4年拿下博士学位。

博士期间,杨植麟与图灵奖得主 Yoshua Bengio 合作发布“火锅问答”数据集 HotpotQA,又以一作身份发表XLNet与Transformer-XL在NLP领域产生重要影响,成为NeurIPS 2019与 ACL 2019 的最高引论文之一,谷歌学术引用次数直接破万……

2016年,杨植麟创立循环智能,公司主要业务是运用NLP、语音、多模态、大模型等人工智能技术打造“销售科技”方案。智谱AI及清华研究团队的多个AI项目由他主导,同时华为的“盘古”大模型也是杨植麟团队和华为云联合推出。

目前,循环智能已进行到B轮融资,并连续三年实现了超200%的营收增长。

尾声

不过,AI大模型研发的烧钱速度,也是摆在所有参赛者眼前不能忽视的“天堑”。

OpenAI推出的超大规模语言生成模型GPT-3单次训练成本就高达460万美元。

资深人工智能研究专家田涛源接受媒体采访时,对成本进一步介绍到:“GPT3.5训练一次需要花费300-460万美金,还只是算力的成本,没算人才的成本,Open AI一共375人左右,一年工资开支就要2亿美金,AI算力开支5亿美元,需要雄厚的资本支撑。”

无论是谁登顶国内AI初创企业的王座,新一轮的“血雨腥风”终无法避免。