打开网易新闻 查看精彩图片

作者|参商

编辑|星奈

媒体|AI大模型工场

打开网易新闻 查看精彩图片

国内大模型发展趋势|9月份解读

Open AI估值破万亿,高层频离职

传了近一个月的融资消息终于尘埃落定,OpenAI宣布最新一轮融资金额66亿美元(约合464亿元人民币),由Thrive Capital领投,投资额13亿美元,微软、软银、英伟达等参投。

这是硅谷史上最大的一次融资,OpenAI投后估值达到了1570亿美元(约合人民币1.1万亿元),成为当之无愧的AI超级独角兽。

不过,此次融资也带来了诸多争议。

首先,OpenAI阻止投资者向竞争对手投资,如xAI、Anthropic、Safe Superintelligence等。这种“排他性协议”,一举在行业内树敌无数,马斯克亲自下场,在X发文称:“OpenAI就是个恶魔。”

其次,此次融资以可转债的形式提供。也就是说,如果OpenAI能转型成为营利性组织,并取消投资者回报上限后,这些投资将转化为股权。否则OpenAI需要向投资者偿还这66亿美元的债务。

看似风光无限的OpenAI,实则暗流涌动。

据外媒报道,OpenAI的财务文件显示,在接下来的一两年中,OpenAI将持续亏损,预计在2026年时亏损高达140亿美元。

尽管OpenAI作为大模型领域的风向标和领头羊,但运营成本与盈利依然短时间无法达到平衡。此外,如果OpenAI两年内无法完成公司结构的重组,那么本轮融资的投资者是否会要求退回投资,达摩克利斯之剑一直悬在OpenAI的头顶。

如果说商业化问题是目前整个行业的“瓶颈”,那么核心技术骨干的流失则是OpenAI深层的痛处。

人工智能正是靠着人才堆砌起来的领域,OpenAI联合创始人Greg Brockman曾在X上发帖:“没有人才,OpenAI什么也不是。”

如今,一语成谶,作为这轮AI大模型浪潮的引领者,OpenAI核心灵魂人物在一个一个地离开。

今年5月OpenAI 联合创始人 Ilya Sutskever和安全负责人Jan Leike相继离职,9月其CTO Mira Murati也宣布离开效忠6年的OpenAI,而Greg Brockman现在也处于长期休假状态,至此,OpneAI的核心四人领导,只剩下奥特曼一个。

有网友甚至做了一张对比图讽刺这一局面:

打开网易新闻 查看精彩图片

一面是资本的狂热,一面是现实的冷峻,OpneAI仅是大模型圈现状的缩影。

“慢思考”受市场追捧,国内360、月之暗面抢先入局

9月中旬,OpneAI发布o1模型,通过模仿人类思维过程,形成具备自动思考与反思能力的“思维链”流程,从而实现复杂推理并解决问题。

之前的大模型更多是进行的“快思考”,也就是大模型在经过大量数据训练后能够快速给出答案,其中不免出现“幻觉”问题。

而o1的推出,“慢思考”重新进入大众视野。所谓“慢思考”,简单来说就是在回答复杂问题之前,模型会经历一段时间的“思考”,通过多步推理和不断试错寻找最佳答案,这种思考模式更接近人类的思维方式,生成的内容更加稳定。

在这种优势下,“慢思考”正在逐渐受到市场的追捧。

值得一提的是,这套“慢思考”的模式并非OpenAI首创,事实上,360早已对“慢思考”有所布局,在今年7月底ISC.AI2024大会上,360集团创始人周鸿祎就宣布:用基于智能体的框架打造慢思考系统,从而增强大模型的慢思考能力。

并在360AI搜索上线基于CoE技术架构的“慢思考模式”,成为国内首个具备慢思考能力的AI产品,并自今年1月份上线以来,在八九个月的时间里登顶成为全球最大访问量的AI原生搜索引擎。9月份,360AI搜索用户访问量更是超2亿次。

而最近两天,月之暗面一经宣布上线Kimi探索版,大量用户涌入,一度导致服务器崩溃,并冲上热搜。

据官方介绍Kimi探索版具备AI自主搜索能力,可以模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,提供更全面和准确的答案。

实际上,探索版就是增加了“思维链”流程,是更具“慢思考”能力的Kimi,它不仅是一个高级AI搜索引擎,更是一个会拆解问题、逐个解决并且能帮你做推理和规划的智能助手。

可以看到,“慢思考”成为大势所趋,不仅在模型层,更在应用层发挥着越来越重要的作用。

诺奖,AI成为焦点:包揽物理、化学奖

在诺贝尔物理奖颁给“人工智能教父”杰弗里·辛顿和普林斯顿大学的约翰·霍普菲尔德时,不仅获奖本人觉得不可思议,大众也是一脸懵逼。

而仅一天之后,诺贝尔化学奖再次颁给用AI模型AlphaFold2来解决蛋白质结构的三位科学家。

诺奖,AI成为焦点。这不仅对诺奖影响深远,更对AI具有里程碑意义,AI for Science的价值在此次诺奖中得到淋漓尽致的体现。

首先,AI技术在物理学和化学领域的应用,展示了其在解决复杂问题上的巨大潜力。

杰弗里·辛顿和约翰·霍普菲尔德的贡献,奠定了现代机器学习的基础,使得AI能够处理大量数据并解决复杂问题。而AlphaFold2模型的成功应用,则展示了AI在生物医学领域的巨大潜力,特别是在蛋白质结构预测和药物发现方面。

其次,这一系列的诺贝尔奖颁发,也反映了科学研究的新趋势,即学科交叉化。

AI技术的应用,使得不同学科之间的界限变得模糊,科学家们可以利用AI技术来解决本学科难以解决的问题。这种跨学科的合作,在未来将成为常态,而人工智能则在其中扮演着重要角色。

国内主要大模型最新进展

百度

9月25日,在2024百度云智大会上,百度智能云宣布将百舸AI异构计算平台全面升级至4.0版本。

据官方介绍,为了解决算力资源短缺的问题,百舸4.0对“多芯混训”能力进行了重点升级,实现了在万卡规模集群上95%的多芯混合训练效能。集群部署环节,升级后的百舸能够实现工具层面的秒级部署,将万卡集群运行准备时间从数周最快缩减至1小时。百舸4.0全面升级了故障检测手段和自动容错机制,在万卡集群上实现了超过99.5%的有效训练时长。

同时,百度智能云宣布,千帆大模型平台全面升级至3.0版本,并公布了最新“成绩单”:在千帆大模型平台上,文心大模型日均调用量超过7亿次,累计帮助用户精调了3万个大模型,开发出70多万个企业级应用。过去一年,文心旗舰大模型降价幅度超过90%。

阿里

9月19日,在2024云栖大会,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭发表主题演讲。他认为,过去22个月,AI发展速度超过任何历史时期,但依然处于AGI变革的早期。生成式AI最大的想象力,绝不是在手机屏幕上做一两个新的超级app,而是接管数字世界,改变物理世界。

阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5,其中,旗舰模型Qwen2.5-72B性能超越Llama 405B,再登全球开源大模型王座。Qwen2.5涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型,每个尺寸都有基础版本、指令跟随版本、量化版本,总计上架100多个模型,刷新业界纪录。

在多模态方面,阿里云也宣布了其在视频领域的最新进展——通义万相全面升级,并发布全新视频生成模型,可生成影视级高清视频,可应用于影视创作、动画设计、广告设计等领域。据介绍,通义万相首批上线文生视频、图生视频功能。即日起,所有用户可通过通义APP及通义万相官网免费体验。

在模型价格方面,继5月首次大幅降价后,阿里云百炼平台上的三款通义千问主力模型再次降价。Qwen-Turbo价格直降85%,低至百万tokens 0.3元,Qwen-Plus和Qwen-Max分别再降价80%和50%。其中,Qwen-Plus推理能力追平GPT4,可应用于复杂任务,是效果、速度及成本均衡的最优选择,降价后,Qwen-Plus性价比达到业界最高,同等规模较行业价格低84%。

360

9月初,360AI助手推出「模型竞技场」功能,用户可以从多个模型中挑选,输入相同提示词,直观地横向对比结果。

另有提示词题库,涵盖了逻辑推理、语言理解等多种题型。帮助用户从多个维度比较模型的性能,让用户的选择更加全面和客观。

9月中下旬,360AI搜索上线“多模型协作”和“慢思考模式”搜索。“慢思考模式”基于思维链策略,模拟人类思维过程,为用户提供更准确、更全面、更优质的答案。

据了解,360AI搜索的“慢思考模式”搜索模式由“360智脑pro”、“豆包”大模型、和“通义千问”大模型协作工作。

腾讯

9月5日消息,腾讯宣布推出新一代大模型“混元Turbo”,据官方介绍,相比前代模型,腾讯混元Turbo训练效率提升108%,推理效率提升100%,推理成本降低50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。

目前腾讯内部近700个业务及场景已接入,包含腾讯元宝、腾讯云、QQ、微信读书、腾讯新闻、腾讯客服等。

同时宣布上线品牌智能体专区,首批入驻腾讯元宝品牌智能体专区的应用覆盖了文娱、旅游、购物、健康、电竞、快递、设计、招聘多个领域,包括阅文集团、同程旅行、微盟、值得买科技、华润三九、快递100、Canva可画、高竞文化、马蜂窝等多家头部企业。

字节跳动

9月24日,字节跳动发布了豆包视频生成模型、豆包音乐模型、豆包同声传译模型。

其中,字节一次上新豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。

据介绍,豆包视频生成模型采用DiT 融合计算单元,可更充分地压缩编码视频与文本,加之全新设计的扩散模型训练方法,带来了多镜头切换保持一致能力。在此基础上,团队还优化了扩散模型训练框架和 Transformer 结构,大幅提升视频生成的泛化性。

豆包音乐模型从词曲唱三个方面来生成音乐作品,还支持图片成曲、灵感成曲、写词成曲多种创作方式;豆包同声传译模型采用端到端的模型架构,让翻译高精准、高质量,时延更低,还支持音色克隆。

智谱AI

9月6日,智谱宣布清言APP视频通话功能,面向所有用户全面放开,限时免费。据介绍,用户在清言 App 点击首页右下方的打 Call 按钮,跳转视频通话后,把摄像头对准你希望让其看到的物品,便可以开启视频通话。

值得一提的是,近日,智谱还新上线了视频通话 API:GLM-4-Plus-VideoCall,它是清言视频通话背后的模型,可以实现视频通话、语音多轮交互等多种跨模态能力。

同时,智谱的全模型家族也正式在bigmodel.cn上线,其中包括备受瞩目的新基座大模型GLM-4-Plus。在最新的SuperBench大模型评测中,GLM-4-Plus凭借出色的性能表现位列世界前三,成功打破了此前国外模型在该领域的垄断地位。

在推动模型普惠方面,近日,智谱在开放平台上线了一个从10月1日起、为期一个月的优惠活动,赠送每位用户1亿tokens额度,提供最高1折的API折扣。

商汤科技

9月2日商汤办公小浣熊正式在联想应用商店上线,用AI为PC用户提升办公效率。借助联想应用商店平台,办公小浣熊用户可以在PC端就能高效地体验AI大模型能力在财务分析、商业分析、销售预测、市场分析等办公场景的应用。

「办公小浣熊」是商汤推出的基于大模型的数据文件处理助手,可通过用户的自然语言输入,结合商汤大模型能力,自动将数据转化为有价值的分析和可视化结果,此前已为数十万用户提供智能辅助服务。

面壁智能

9月 6日面壁智能宣布推出开源 MiniCPM3-4B AI 模型,声称“端侧 ChatGPT 时刻到来”。

MiniCPM3-4B 是 MiniCPM 系列的第三代产品,整体性能超过了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,媲美多款 70 亿~90 亿参数的 AI 模型。相比 MiniCPM1.0 / MiniCPM2.0,MiniCPM3-4B 拥有更强大、更多用途的技能集,可用于更广泛的用途。MiniCPM3-4B 支持函数调用和代码解释器。

此外,面壁智能还发布了 RAG 套件 MiniCPM-Embedding 模型和 MiniCPM-Reranker 模型,针对 RAG 场景还发布了微调版 MiniCPM3-RAG-LoRA 模型。

9月19日,快手可灵发布1.5模型,支持在高品质模式下,生成1080p高清视频,且生成价格不变。

同时新增运动笔刷功能,支持为图片中的元素(人或物体等)指定运动轨迹;支持额外指定静止区域支;持横屏、竖屏、方屏等多种尺寸格式的图片,提升画面可控性。

近日,可灵新增「对口型」功能,在可灵AI生成人物视频后,点击预览视频下的「对口型」按钮,上传音频,即可让视频人物口型和音频同步。