(图片来源:跃问视频demo)
生成式 AI 领域的技术竞赛不断加剧,已进入到“白热化”阶段。
今年以来,OpenAI接连发布Sora、GPT-4o、o1系列等多款模型,引发关注。此外,Runway 发布全新图像模型 Framer、Midjourney 准备发布 V7 版本、Claude 3.5 模型升级,而英伟达公布全新AI音频模型Fugatto。
回到国内,字节跳动、百度、腾讯等大厂接连公布大模型技术和产品进展,开始用大模型实现“卖云”的增值。
国内大模型创业公司也在加速狂奔。
钛媒体App获悉,11月27日,专注于通用人工智能大模型(AGI)研发的公司“阶跃星辰”(StepFun),日前已悄然开启视频生成模型 Step-Video 内测,用户可通过“跃问”官网的“跃问视频”产品进行点击申请,且第二版视频生成模型已经在研发中。
公开资料显示,这家行事低调的大模型独角兽,在8个月内接连发布了至少6款基座模型,且近期多款模型因为强悍的技术实力在国际上大放异彩。
短短一周内,阶跃星辰多模态理解大模型Step-1V、万亿参数语言大模型Step-2分别跻身全球权威大模型评测基准榜单LMSYS大模型竞技场 Chatbot Arena和LiveBench前列,皆位列中国大模型第一。
其中,Step-1V在LMSYS Chatbot Arena上,总分跟 Gemini-1.5-Flash-8B-Exp-0827 持平;Step-2在LiveBench榜单上的成绩逼近 OpenAI 的 o1-mini-2024-09-12,超越 gpt-4o-2024-08-06 等国际主流模型,也是唯一进入榜单前十名的中国语言大模型。
(图片来自 LiveBench 官网,截至今年11月19日数据)
“狂飙”600余天,阶跃星辰建立全面模型矩阵
11月30日,OpenAI将迎来AI聊天机器人ChatGPT发布两周年之日。
回顾过去两年,ChatGPT引爆了全球新一轮 AI 大模型“造模”热潮。《全球数字经济白皮书(2024年)》报告显示,目前,全球AI大模型数量已达1328个,其中美国占比最多达44%,中国占36%,这两个国家已经牢牢占据大模型领域的第一梯队。
全球AI大模型市场的竞争格局日益激烈。
在这一轮生成式AI热潮中,国内最先起跑的是创业公司。成立于2023年4月的阶跃星辰,在600多天的时间里,已形成行业领先的综合技术实力。
包括近期低调内测的Step-Video在内,阶跃星辰已经推出了Step系列通用大模型矩阵,涵盖从千亿到万亿参数、从理解到生成、从语言到多模态的全方位能力:
- Step-1千亿参数语言大模型:两个月一次性训练成功,已完成充分打磨,在逻辑推理、中文知识、英文知识、数学、代码方面的性能全面超越 GPT-3.5。
- Step-1V多模态大模型:性能比肩 GPT-4V,可以精准描述和理解图像中的文字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理、数据分析等多项任务。
- Step-2 万亿参数语言大模型:采用MoE架构,聚焦深度智能的探索,这是国内首个由创业公司发布的万亿参数语言大模型。Step-2 在语言生成上对细节有极强的控制力,模型能够更好地理解和遵循人类指令。
- Step-1.5V多模态大模型:在Step-1V的基础上进行了迭代,具备更强大的多模态理解能力,实现了从图像理解到视频理解的跨越升级。
- Step-1X图像生成大模型:具有强大语义理解与图像创意实现能力,可用于各种图像创作和设计任务。
- Step-Video视频生成大模型:支持文生视频,可生成 1080P 长达 10s 的高清视频,在语义理解、指令遵循、运动、中国风美学生成上效果突出。目前模型已经接入“跃问视频”并开始内测。
从上述两个demo片段中,我们可以看到,无论是语义理解能力,细节运动符合物理规律,还是清晰度,阶跃星辰的Step-Video视频生成模型均达到业界先进水平。
事实上,在大模型“六小虎”中,阶跃星辰以多模态模型技术实力强劲著称。根据阶跃星辰创始人、CEO姜大昕的规划,阶跃星辰实现AGI的技术路线是:“单模态 — 多模态 — 多模理解和生成的统一 — 世界模型 — AGI”。
他曾多次强调,只有解决了多模态理解生成一体化,才能彻底建立一个世界模型,再往后才能跟具身智能结合,最终实现AGI,以此提升社会、经济产业的能力与价值。
2028年超4万亿规模,大模型加速技术落地
据研究机构IDC最新数据显示,预计到2028年,全球 AI 产业支出将达到6320亿美元(约合人民币4.58万亿元),几乎是当前的两倍,5年间复合年增长率 (CAGR) 达29%。
其中,生成式AI成为最大的增长引擎,到2028年该领域投资支出高达2020亿美元,占整个 AI 支出的32%,CAGR达59.2%。
不过,当前生成式AI产业仍处于非常早期的阶段。
中国工程院院士、北京大学博雅讲席教授、鹏城实验室主任高文认为,如果以“人”来相比,AGI现在可能还是刚刚会走路的幼儿状态。但从使用角度看,AI已经能解决生产、社会、服务的问题,可以先用起来,没有必要等到十全十美再去用,要把它逐步的开发、完善、迭代。
越来越多的开发者和企业开始基于阶跃星辰的大模型矩阵打造AI应用。阶跃星辰开放平台逐渐形成了一个大模型“生态伙伴圈”。金融财经、内容创作、消费娱乐等领域的头部机构纷纷跟阶跃星辰达成技术合作。其中,财联社跟阶跃星辰共同打造了国内首个千亿参数多模态金融大模型“财跃F1金融大模型”。
开发者则通过阶跃星辰的 Step 系列大模型尝试新的产品形态。独立开发者赵纯想将包括网红AI应用“胃之书”在内的三款产品都接入了阶跃星辰 Step 系列大模型,原因是胃之书早期对国内所有大模型做了产品 AB test 测试,他发现使用阶跃星辰的模型,用户付费率最高;AI 心理疗愈应用“林间聊愈室”则是基于阶跃星辰多模态大模型的图片理解能力,上线了呼声已久的 AI 识图功能,用户可以跟小动物分享自己的生活场景、状态等,林间聊愈室CEO李神龙表示,接入新功能之后,比较明显的是付费率确实上涨了。
下一步,我们相信,阶跃星辰这类坚持AGI底层技术探索,加速模型应用落地的公司,将成为AGI时代的关键“推手”,同时也是AGI产业的技术领先者。
智能阶跃,十倍每一个人的可能。
(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)
热门跟贴