上周,负责维护和管理 ARC-AGI的 Arc Prize Foundation对OpenAI即将推出的o3推理AI模型的成本估算进行了重大修正,预计每项ARC-AGI任务的费用将达到30,000美元,这一价格比最初的3,000美元高出十倍。
据彭博社记者 Mark Gurman 消息称,Meta 计划最早在今年年底向市场推出第一副带屏幕的眼镜,售价将超过 1000 美元,最高在 1300-1400 美元左右。
过去一天,国内外AI行业还有更多热点可以关注,乌鸦君带你一起看看。
大模型
1)理想汽车首发「车载自主决策推理模型」
4 月 2 日,理想汽车 OTA 7.2 版本车机系统正式开启推送。其中最值得关注的,便是理想同学拥有了自主决策思考方式。
具体来看,本次 OTA 中,理想基于海量车载场景数据,以及通用推理模型深度思考训练数据,量身打造了自主决策推理模型,在保证模型效果的同时还大幅提升响应速度。借助推理模型,用户可以让理想同学解读影视文学作品,撰写生动故事,或者给出更详实的生活建议等等。
目前车主用户在理想同学的设置中,只需打开「深度思考」开关,理想同学能够根据问题内容自主决策是否深度思考,面对车控指令等简单问题时,能够保障响应速度。
2)微软 CEO:Scaling Law 正给 AI 带来巨大转变
3 月 27 日,微软 CEO Satya Nadella 在日本微软 AI 巡回活动中发表演讲。
开篇,Satya Nadella 便聊到时下热门的 Scaling Law。他表示,伴随着深度学习带来的革命性突破,团队开始观察到一系列基础性的预训练 Scaling Law,正促使 AI 能力大约每六个月实现一次翻倍。Satya Nadella 还透露,计算领域所带来的 Scaling Law 也一同并入了发展的曲线中,事实上 AI 能力已缩短至「每三个月一次翻倍」。
结合上述情况,Satya Nadella 指出,AI 快速发展带来了更低的使用价格,而真正问题在于,人类需要如何高效利用这些强大的 AI 能力。Satya Nadella 总结了三大根本性突破,来阐述了如何更好地发挥 AI 的能力,并重塑整个生活乃至社会领域:
第一大突破在于用户界面。随着多模态模型的能力日趋强大,交互方式也变得越来越自然流畅,用户将可以直接与 AI 进行对话;AI 将能融入人类的周遭世界,变得更加无感,同时能够渗透到每一个部分,无论虚拟还是现实;
第二点,人类还将获得在规划和推理方面强大的赋能。Satya Nadella 解释,AI 不再仅仅局限于处理输入和输出信息,用户可以让它进行长远规划、前瞻性思考以及复杂的逻辑推理;
基于第二点,用户甚至可以赋予 AI 更为复杂的长期记忆能力和更丰富的上下文信息,从而确保它的回应和行动都有可靠的事实依据,即让 AI 能够基于特定的背景知识以及过往的交互历史来进行思考和运作。
因此 Satya Nadella 认为,上述三项核心能力——「自然的交互界面」「强大的规划与推理」「基于背景和记忆的事实依据」,将对整个技术栈产生极为深远的影响。
3)字节跳动在Hugging Face发布MegaTTS3:轻量化语音合成新突破
字节跳动在Hugging Face上发布了其最新的文本转语音模型MegaTTS3,吸引了全球AI研究者的关注。该模型以其轻量化设计和多语言支持而闻名,参数仅为0.45亿,适合资源受限的设备使用。MegaTTS3不仅支持中英混合朗读,还具备口音强度控制功能,进一步提升了个性化语音应用的可能性。
4)OpenAI的o3模型成本修正:每任务价格或将达到30,000美元
Arc Prize Foundation对OpenAI即将推出的o3推理AI模型的成本估算进行了重大修正,预计每项ARC-AGI任务的费用将达到30,000美元,这一价格比最初的3,000美元高出十倍。尽管o3尚未正式发布,Arc Prize Foundation认为o1-pro模型的成本更能反映o3的真实情况。
5)即梦3.0内测:可直出2K商业海报
即梦3.0模型在图像生成领域取得了重大突破,能够通过简单的文字提示生成高质量、细节丰富的图像。其对复杂场景和细节的精准把控,使得生成的视觉效果超越了传统设计师的手工绘制水平。
AI应用
1)北京正式出台《自动驾驶汽车条例》
据北京日报报道,4 月 1 日,《北京市自动驾驶汽车条例》正式施行,支持自动驾驶汽车用于个人乘用车、城市公共汽电车、出租车、城市运行保障等出行服务,符合条件的自动驾驶车辆可开展道路应用试点。
《条例》中所指的自动驾驶汽车,是指可以由自动驾驶系统操作在道路上安全行驶的汽车,包括按照国家标准具备有条件自动驾驶、高度自动驾驶、完全自动驾驶功能的汽车。
2)美国初创和 90 后「大牛」与智元arch-href="newsapp://nc/search?entry=articleKeyword&word=%E6%9C%BA%E5%99%A8%E4%BA%BA">机器人达成合作
4 月 2 日,稚晖君旗下创企智元机器人宣布与国际顶尖具身智能公司 Physical Intelligence(Pi) 携手,一同还公布了一个重磅消息:90 后机器人大神罗剑岚博士将全面领导智元具身智能研究中心。
先看智元机器人与 Physical Intelligence 的合作:双方将围绕动态环境下的长周期复杂任务,在具身智能领域展开深度技术合作。智元方面表示,其与 Pi 的合作目前已经初具成效,可以实现一个通用模型根据不同的指令输入执行多个任务,也可以适配多种末端执行器。据了解,Physical Intelligence 作为一家美国明星初创,于去年 3 月亮相,其团队中有大量机器人和 AI 领域的人才。
信息显示,该公司在去年 11 月完成了 4 亿美元的 A 轮融资,融资后估值为 20 亿美元,主要投资者包括亚马逊创始人贝索斯、OpenAI、Thrive Capital 等知名公司或投资机构。
3)Meta 计划今年推出全新 AR 眼镜
据彭博社记者 Mark Gurman 消息称,Meta 计划最早在今年年底向市场推出第一副带屏幕的眼镜,售价将超过 1000 美元,最高在 1300-1400 美元左右。作为对比,不带屏幕的智能眼镜 Ray-Ban Meta 售价 399 美元,折合人民币 3000 元左右。
去年,Meta 曾展示了「Orion」AR 眼镜的原型机;但本次爆料的机型代号为「Hypernova」,并非前者。
4)第四范式旗下品牌推出 AI 手表
昨日,Phancy 携手兰博基尼、李小龙推出的两款 AI 手表正式亮相。据悉,两款手表通过搭载 Phancy「AI 机芯」,即为用户提供 AI 智能体模组,以及 AI Agent 功能、操作系统等软硬件解决方案,让手表在轻奢、时尚的外表下,注入了丰富的 AI 能力。
Phancy 介绍,用户可通过语音、按键等多种方式唤醒手表中的 AI 助手,体验天气、股票、资讯等信息查询、翻译、同声传译、会议速记及纪要整理、智能导航、运动助手等丰富的 AI 功能。未来,AI Agent 能力还会持续扩充。
5)夸克上线「一键变方」AI 生图功能
近日,夸克 App 上线「一键变方」AI 生图功能。官方介绍,用户在夸克中的「AI 生图」专区,只需要倒入想要风格转换的图片,选择「一键变方」,即可生成类似《我的世界》风格的图片,无论人、宠物还是风景,均可实现风格转变。
6)Genspark发布自动化AI代理Super Agent 具备自主思考、调用工具的能力
Genspark最近推出了其全新的自动化AI代理Super Agent,凭借其强大的自主思考和任务执行能力,迅速成为行业的焦点。该系统采用了创新的多智能体混合系统设计,能够在多种场景下高效处理任务,从日常事务到复杂研究均展现出巨大潜力。尽管其实用性令人印象深刻,但仍需解决一些关于系统透明度和数据隐私的问题。
投融资情报
1)贝恩资本领投斯坦福团队破解AI销售,Actively AI获A轮融资2250万美元
TechCrunch 透露,Actively AI已从 Bain Capital Ventures 获得 1750 万美元的 A 轮融资。此前还有来自 First Round Capital 未公开的 500 万美元种子轮融资,使总融资额达到 2250 万美元。
成立于 2022 年的 Actively AI 主张采用不同方法。该初创公司为企业定制“推理”模型,通过筛选数据寻找最具价值的销售目标,模拟顶尖人类销售代表的工作方式。
这是一种运用推理技术的新途径,该技术通过迫使 AI 模型完善其逻辑并复核工作成果,已在 AI 界引起轰动。积极宣称该方法行之有效,并大力宣传其已帮助如金融科技公司 Ramp 等客户获得数千万美元的额外收入。
PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。
热门跟贴