近日,据月之暗面 Kimi 开放平台显示,共计 9 款模型推理服务进行价格下调,其中包括 kimi-latest-8k、moonshot-v1-8k、moonshot-v1-8k-vision-preview。

昨晚,谷歌在Google Cloud Next 25大会上,开源了首个标准智能体交互协议,Agent2Agent(A2A),旨在促进不同AI智能体之间的协作与信息交换。

过去一天,国内外AI行业还有更多热点可以关注,乌鸦君带你一起看看。

大模型

1)英伟达开源新模型,性能直逼 DeepSeek-R1

今天,英伟达开源了一款名为 Llama-3.1-Nemotron-Ultra-253B-v1 的新模型。该模型基于 Meta 早期的 Llama-3.1-405B-Instruct 模型开发,拥有 2530 亿个参数,在多项第三方基准测试中表现出色:

值得关注的是,英伟达新模型的性能逼近拥有 6710 亿参数的 DeepSeek R1,但只用了不到一半的参数量。

测试结果显示,GPQA(76 vs. 71.5)、IFEval 指令遵循(89.5 vs. 88.8)和 LiveCodeBench 编码任务(66.3 vs. 65.9)。并且,Llama-3.1-Nemotron-Ultra-253B 推理吞吐量也比 DeepSeek R1 671B 高 4 倍。

但在 MATH500 和 Arena Hard 基准测试中,DeepSeek R1 仍略占优势。

2)Kimi 多款模型宣布降价

近日,据月之暗面 Kimi 开放平台显示,共计 9 款模型推理服务进行价格下调,其中包括 kimi-latest-8k、moonshot-v1-8k、moonshot-v1-8k-vision-preview,具体来看:

输入输出价格由之前的 12 元/百万 tokens,调整为输入 2 元/百万 tokens,输出 10 元/百万 tokens;

Kimi 开放平台还对上下文缓存的价格进行了调整:多款模型 Cache 创建价格降至 4 元/百万 tokens,Cache 存储降至 1 元/百万 tokens/min。

Kimi 开放平台表示,通过技术创新,其成功降低了模型的推理成本,提高了推理速度,这不仅让模型能够更快速地响应用户需求,也为用户带来了更流畅的体验。

3)百度官宣:文心大模型4.5Turbo将于4月25日发布

百度宣布将在4月25日的Create大会上发布文心大模型4.5Turbo,尽管具体细节尚未披露,但业界对此充满期待。文心大模型4.5及文心大模型X1已于上月发布并向用户免费开放,展现了百度在AI领域的深厚积累。文心大模型4.5在多模态理解能力上表现卓越,API调用价格极具竞争力,吸引了众多开发者和企业的关注。

4)京东零售推出首个自研十亿级时序大模型TimeHF 可预测商品销量

京东零售技术团队成功推出了自研的十亿级销量预测时序大模型TimeHF,该模型通过人类反馈的强化学习技术实现了销量预测的显著提升,准确度提高了10%以上。TimeHF在京东的自动化补货场景中表现卓越,并在多个公开数据集上超越了行业水平,成为时序预测的新标杆。

AI应用

1)阿里 AI 智能眼镜将在年底发布

近日,根据维深信息 Wellsenn XR 独家信息,阿里已经确定了 AI 智能眼镜项目方案,目前正在积极招聘和扩充团队。

据了解,阿里 AI 智能眼镜主要由智能信息事业群旗下的天猫精灵团队负责,硬件规格将超越目前火爆的 Ray-Ban Meta 智能眼镜:

采用高通 AR1 芯片 + 恒玄 BES2800 双芯片双系统架构,在功耗和续航方面将有更优秀的表现。

眼镜摄像头与 Ray-Ban Meta 一样采用索尼 IMX681 CMOS,1200 万像素,摄像头模组由立景提供,整机代工则由立讯承接。

较为惊喜的是,阿里 AI 智能眼镜将分为两个版本,其中一款为带显示的 AI+AR 智能眼镜,并且该版本的优先级更高。报道称,AR 版本将采用表面浮雕光栅衍射光波导,采用了单绿色的 Micro LED 光机模组。

2)Google Deep Research 迎来重大更新

昨日,Google 正式为 Gemini Advanced 订阅用户更新基于 Gemini 2.5 Pro 的 Deep Research 功能,据介绍,该版本的 Deep Research 将拥有以下提升:

逻辑更加清晰,能提供更具深度的结论;

信息整合能力提升,从海量数据中快速提取重要内容,并且能化繁为简;

能生成更加详细的报告,并提供一定的独特角度见解。

Google 还放出了新版 Deep Research 与 OpenAI 的 Deep Research 对比。从结果显示,Google Deep Research 多项性能测试大幅领先 OpenAI 的 DR,整体性能提升超 40%。Google 也在报告中透露,Google Deep Research 生成的报告受到评估者的选择,程度远超其他 DR 工具 2 倍多。

3)AI Agent巨变!谷歌重磅发布开源A2A协议,实现智能体间的自由“对话”

谷歌云推出全新的开源协议Agent2Agent(A2A),旨在促进不同AI智能体之间的协作与信息交换。这一协议通过标准化的通信方法,打破了智能体之间的壁垒,解决了信息孤岛的问题。A2A协议的设计原则包括支持长期任务、默认安全和模态无关等,确保了其在复杂AI应用中的适用性。

4)Anthropic 推出 Claude Max 高端订阅服务,月费最高达200美元

Anthropic 公司最近推出了 Claude Max 订阅计划,旨在满足高端用户对人工智能服务的需求。该计划提供两种定价选项,分别为每月100美元和200美元,使用限制显著提高,吸引了更多用户。虽然目前没有无限制使用的方案,但公司正在积极探索其他收入渠道,包括针对教育领域的“Claude for Education”项目。

5)效仿OpenAI,谷歌Gemini加入MCP阵营,加速AI代理互联互通

谷歌在 OpenAI 采纳 Anthropic 的模型上下文协议(MCP)后,宣布将其 Gemini 模型和软件开发工具包(SDK)中增加对 MCP 的支持。MCP 作为开放标准,允许 AI 模型从多种数据源提取信息,促进开发者与 AI 应用之间的双向连接。此举标志着 AI 代理互联互通的加速,吸引了多个公司集成 MCP,显示出行业对开放协议的重视与合作潜力。

投融资情报

1)星尘智能获锦秋基金、蚂蚁集团等投资

近日,星尘智能连续完成A轮及A+轮融资数亿元,由锦秋基金、蚂蚁集团领投,云启资本、道彤资本等老股东跟投,华兴资本担任独家财务顾问。

星尘智能(Astribot)于2022年底在深圳成立,致力于让数十亿人拥有AI机器人助理,推动人机共存、共创、共赢。公司首创面向AI(Design for AI,DFAI)的软硬件一体化系统架构,将“AI智能”与“最强操作”深度耦合,在具身智能数据采集与处理方面取得关键突破,让机器人能像人一样学习、思考和劳动,与人流畅智能交互,使用人的工具和设备、帮人完成枯燥、困难或危险的任务,奠定了独特技术优势。

PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。