中国AI大模型平台排行榜 | 9月|ai|大模型|智能体|模态

作者｜参商

编辑｜星奈

媒体｜AI大模型工场

国内大模型发展趋势|9月份解读

Open AI估值破万亿，高层频离职

传了近一个月的融资消息终于尘埃落定，OpenAI宣布最新一轮融资金额66亿美元（约合464亿元人民币），由Thrive Capital领投，投资额13亿美元，微软、软银、英伟达等参投。

这是硅谷史上最大的一次融资，OpenAI投后估值达到了1570亿美元（约合人民币1.1万亿元），成为当之无愧的AI超级独角兽。

不过，此次融资也带来了诸多争议。

首先，OpenAI阻止投资者向竞争对手投资，如xAI、Anthropic、Safe Superintelligence等。这种“排他性协议”，一举在行业内树敌无数，马斯克亲自下场，在X发文称：“OpenAI就是个恶魔。”

其次，此次融资以可转债的形式提供。也就是说，如果OpenAI能转型成为营利性组织，并取消投资者回报上限后，这些投资将转化为股权。否则OpenAI需要向投资者偿还这66亿美元的债务。

看似风光无限的OpenAI，实则暗流涌动。

据外媒报道，OpenAI的财务文件显示，在接下来的一两年中，OpenAI将持续亏损，预计在2026年时亏损高达140亿美元。

尽管OpenAI作为大模型领域的风向标和领头羊，但运营成本与盈利依然短时间无法达到平衡。此外，如果OpenAI两年内无法完成公司结构的重组，那么本轮融资的投资者是否会要求退回投资，达摩克利斯之剑一直悬在OpenAI的头顶。

如果说商业化问题是目前整个行业的“瓶颈”，那么核心技术骨干的流失则是OpenAI深层的痛处。

人工智能正是靠着人才堆砌起来的领域，OpenAI联合创始人Greg Brockman曾在X上发帖：“没有人才，OpenAI什么也不是。”

如今，一语成谶，作为这轮AI大模型浪潮的引领者，OpenAI核心灵魂人物在一个一个地离开。

今年5月OpenAI 联合创始人 Ilya Sutskever和安全负责人Jan Leike相继离职，9月其CTO Mira Murati也宣布离开效忠6年的OpenAI，而Greg Brockman现在也处于长期休假状态，至此，OpneAI的核心四人领导，只剩下奥特曼一个。

有网友甚至做了一张对比图讽刺这一局面：

一面是资本的狂热，一面是现实的冷峻，OpneAI仅是大模型圈现状的缩影。

“慢思考”受市场追捧，国内360、月之暗面抢先入局

9月中旬，OpneAI发布o1模型，通过模仿人类思维过程，形成具备自动思考与反思能力的“思维链”流程，从而实现复杂推理并解决问题。

之前的大模型更多是进行的“快思考”，也就是大模型在经过大量数据训练后能够快速给出答案，其中不免出现“幻觉”问题。

而o1的推出，“慢思考”重新进入大众视野。所谓“慢思考”，简单来说就是在回答复杂问题之前，模型会经历一段时间的“思考”，通过多步推理和不断试错寻找最佳答案，这种思考模式更接近人类的思维方式，生成的内容更加稳定。

在这种优势下，“慢思考”正在逐渐受到市场的追捧。

值得一提的是，这套“慢思考”的模式并非OpenAI首创，事实上，360早已对“慢思考”有所布局，在今年7月底ISC.AI2024大会上，360集团创始人周鸿祎就宣布：用基于智能体的框架打造慢思考系统，从而增强大模型的慢思考能力。

并在360AI搜索上线基于CoE技术架构的“慢思考模式”，成为国内首个具备慢思考能力的AI产品，并自今年1月份上线以来，在八九个月的时间里登顶成为全球最大访问量的AI原生搜索引擎。9月份，360AI搜索用户访问量更是超2亿次。

而最近两天，月之暗面一经宣布上线Kimi探索版，大量用户涌入，一度导致服务器崩溃，并冲上热搜。

据官方介绍Kimi探索版具备AI自主搜索能力，可以模拟人类的推理思考过程，多级分解复杂问题，执行深度搜索，并即时反思改进结果，提供更全面和准确的答案。

实际上，探索版就是增加了“思维链”流程，是更具“慢思考”能力的Kimi，它不仅是一个高级AI搜索引擎，更是一个会拆解问题、逐个解决并且能帮你做推理和规划的智能助手。

可以看到，“慢思考”成为大势所趋，不仅在模型层，更在应用层发挥着越来越重要的作用。

诺奖，AI成为焦点：包揽物理、化学奖

在诺贝尔物理奖颁给“人工智能教父”杰弗里·辛顿和普林斯顿大学的约翰·霍普菲尔德时，不仅获奖本人觉得不可思议，大众也是一脸懵逼。

而仅一天之后，诺贝尔化学奖再次颁给用AI模型AlphaFold2来解决蛋白质结构的三位科学家。

诺奖，AI成为焦点。这不仅对诺奖影响深远，更对AI具有里程碑意义，AI for Science的价值在此次诺奖中得到淋漓尽致的体现。

首先，AI技术在物理学和化学领域的应用，展示了其在解决复杂问题上的巨大潜力。

杰弗里·辛顿和约翰·霍普菲尔德的贡献，奠定了现代机器学习的基础，使得AI能够处理大量数据并解决复杂问题。而AlphaFold2模型的成功应用，则展示了AI在生物医学领域的巨大潜力，特别是在蛋白质结构预测和药物发现方面。

其次，这一系列的诺贝尔奖颁发，也反映了科学研究的新趋势，即学科交叉化。

AI技术的应用，使得不同学科之间的界限变得模糊，科学家们可以利用AI技术来解决本学科难以解决的问题。这种跨学科的合作，在未来将成为常态，而人工智能则在其中扮演着重要角色。

国内主要大模型最新进展

百度

9月25日，在2024百度云智大会上，百度智能云宣布将百舸AI异构计算平台全面升级至4.0版本。

据官方介绍，为了解决算力资源短缺的问题，百舸4.0对“多芯混训”能力进行了重点升级，实现了在万卡规模集群上95%的多芯混合训练效能。集群部署环节，升级后的百舸能够实现工具层面的秒级部署，将万卡集群运行准备时间从数周最快缩减至1小时。百舸4.0全面升级了故障检测手段和自动容错机制，在万卡集群上实现了超过99.5%的有效训练时长。

同时，百度智能云宣布，千帆大模型平台全面升级至3.0版本，并公布了最新“成绩单”：在千帆大模型平台上，文心大模型日均调用量超过7亿次，累计帮助用户精调了3万个大模型，开发出70多万个企业级应用。过去一年，文心旗舰大模型降价幅度超过90%。

阿里

9月19日，在2024云栖大会，阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭发表主题演讲。他认为，过去22个月，AI发展速度超过任何历史时期，但依然处于AGI变革的早期。生成式AI最大的想象力，绝不是在手机屏幕上做一两个新的超级app，而是接管数字世界，改变物理世界。

阿里云CTO周靖人发布通义千问新一代开源模型Qwen2.5，其中，旗舰模型Qwen2.5-72B性能超越Llama 405B，再登全球开源大模型王座。Qwen2.5涵盖多个尺寸的大语言模型、多模态模型、数学模型和代码模型，每个尺寸都有基础版本、指令跟随版本、量化版本，总计上架100多个模型，刷新业界纪录。

在多模态方面，阿里云也宣布了其在视频领域的最新进展——通义万相全面升级，并发布全新视频生成模型，可生成影视级高清视频，可应用于影视创作、动画设计、广告设计等领域。据介绍，通义万相首批上线文生视频、图生视频功能。即日起，所有用户可通过通义APP及通义万相官网免费体验。

在模型价格方面，继5月首次大幅降价后，阿里云百炼平台上的三款通义千问主力模型再次降价。Qwen-Turbo价格直降85%，低至百万tokens 0.3元，Qwen-Plus和Qwen-Max分别再降价80%和50%。其中，Qwen-Plus推理能力追平GPT4，可应用于复杂任务，是效果、速度及成本均衡的最优选择，降价后，Qwen-Plus性价比达到业界最高，同等规模较行业价格低84%。

360

9月初，360AI助手推出「模型竞技场」功能，用户可以从多个模型中挑选，输入相同提示词，直观地横向对比结果。

另有提示词题库，涵盖了逻辑推理、语言理解等多种题型。帮助用户从多个维度比较模型的性能，让用户的选择更加全面和客观。

9月中下旬，360AI搜索上线“多模型协作”和“慢思考模式”搜索。“慢思考模式”基于思维链策略，模拟人类思维过程，为用户提供更准确、更全面、更优质的答案。

据了解，360AI搜索的“慢思考模式”搜索模式由“360智脑pro”、“豆包”大模型、和“通义千问”大模型协作工作。

腾讯

9月5日消息，腾讯宣布推出新一代大模型“混元Turbo”，据官方介绍，相比前代模型，腾讯混元Turbo训练效率提升108%，推理效率提升100%，推理成本降低50%，解码速度提升 20%，效果在多个基准测试上对标GPT-4o。

目前腾讯内部近700个业务及场景已接入，包含腾讯元宝、腾讯云、QQ、微信读书、腾讯新闻、腾讯客服等。

同时宣布上线品牌智能体专区，首批入驻腾讯元宝品牌智能体专区的应用覆盖了文娱、旅游、购物、健康、电竞、快递、设计、招聘多个领域，包括阅文集团、同程旅行、微盟、值得买科技、华润三九、快递100、Canva可画、高竞文化、马蜂窝等多家头部企业。

字节跳动

9月24日，字节跳动发布了豆包视频生成模型、豆包音乐模型、豆包同声传译模型。

其中，字节一次上新豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型，面向企业市场开启邀测。

据介绍，豆包视频生成模型采用DiT 融合计算单元，可更充分地压缩编码视频与文本，加之全新设计的扩散模型训练方法，带来了多镜头切换保持一致能力。在此基础上，团队还优化了扩散模型训练框架和 Transformer 结构，大幅提升视频生成的泛化性。

豆包音乐模型从词曲唱三个方面来生成音乐作品，还支持图片成曲、灵感成曲、写词成曲多种创作方式；豆包同声传译模型采用端到端的模型架构，让翻译高精准、高质量，时延更低，还支持音色克隆。

智谱AI

9月6日，智谱宣布清言APP视频通话功能，面向所有用户全面放开，限时免费。据介绍，用户在清言 App 点击首页右下方的打 Call 按钮，跳转视频通话后，把摄像头对准你希望让其看到的物品，便可以开启视频通话。

值得一提的是，近日，智谱还新上线了视频通话 API：GLM-4-Plus-VideoCall，它是清言视频通话背后的模型，可以实现视频通话、语音多轮交互等多种跨模态能力。

同时，智谱的全模型家族也正式在bigmodel.cn上线，其中包括备受瞩目的新基座大模型GLM-4-Plus。在最新的SuperBench大模型评测中，GLM-4-Plus凭借出色的性能表现位列世界前三，成功打破了此前国外模型在该领域的垄断地位。

在推动模型普惠方面，近日，智谱在开放平台上线了一个从10月1日起、为期一个月的优惠活动，赠送每位用户1亿tokens额度，提供最高1折的API折扣。

商汤科技

9月2日商汤办公小浣熊正式在联想应用商店上线，用AI为PC用户提升办公效率。借助联想应用商店平台，办公小浣熊用户可以在PC端就能高效地体验AI大模型能力在财务分析、商业分析、销售预测、市场分析等办公场景的应用。

「办公小浣熊」是商汤推出的基于大模型的数据文件处理助手，可通过用户的自然语言输入，结合商汤大模型能力，自动将数据转化为有价值的分析和可视化结果，此前已为数十万用户提供智能辅助服务。

面壁智能

9月 6日面壁智能宣布推出开源 MiniCPM3-4B AI 模型，声称“端侧 ChatGPT 时刻到来”。

MiniCPM3-4B 是 MiniCPM 系列的第三代产品，整体性能超过了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125，媲美多款 70 亿~90 亿参数的 AI 模型。相比 MiniCPM1.0 / MiniCPM2.0，MiniCPM3-4B 拥有更强大、更多用途的技能集，可用于更广泛的用途。MiniCPM3-4B 支持函数调用和代码解释器。

此外，面壁智能还发布了 RAG 套件 MiniCPM-Embedding 模型和 MiniCPM-Reranker 模型，针对 RAG 场景还发布了微调版 MiniCPM3-RAG-LoRA 模型。

9月19日，快手可灵发布1.5模型，支持在高品质模式下，生成1080p高清视频，且生成价格不变。

同时新增运动笔刷功能，支持为图片中的元素（人或物体等）指定运动轨迹；支持额外指定静止区域支；持横屏、竖屏、方屏等多种尺寸格式的图片，提升画面可控性。

近日，可灵新增「对口型」功能，在可灵AI生成人物视频后，点击预览视频下的「对口型」按钮，上传音频，即可让视频人物口型和音频同步。