AI早报 | 马斯克宣布推出文本转视频 AI 工具 Grok Imagine;海康威视已推出数百款大模型产品
近期,几家知名企业在人工智能领域的动态引人关注。马斯克推出新的文本转视频工具Grok Imagine,被称为“AI版的Vine”。尽管该工具具有创新性,但目前仍处于测试阶段,尚未全面推出。此外,OpenAI获得83亿美元融资,为其IPO铺路,而海康威视则披露其机器人业务IPO仍在排队中。同时,中国电子学会指出我国人形机器人的运动性和灵巧性取得重大突破,稳居全球领先地位。
刚刚,小米又开源一大模型,22个公开测评SOTA
小米公司于8月4日正式开源声音理解大模型MiDashengLM-7B,该模型在音频理解任务中刷新了多模态大模型的最好成绩(SOTA)。尽管该模型展示出先进性能,其设计仍面临挑战,包括在VoxCeleb-Gender项目上略微落后于竞争对手Kimi的7B模型。同时,在语音识别任务中,MiDashengLM-7B在某些测试中未达到Qwen和Kimi的表现。模型的首Token延迟虽然降低,但其数据利用率问题仍需解决。
苹果秘密AI团队曝光,要复刻ChatGPT
近日有报道揭示苹果正组建“Answers, Knowledge and Information”(AKI)团队,旨在开发类似ChatGPT的搜索引擎,以解决Siri对话式搜索能力不足的问题。该团队由前Siri负责人罗比·沃克领导,目标是打造具备网页抓取与知识回答能力的“Answer Engine”。同时,苹果面临市场竞争压力,Meta的马克·扎克伯格提出AI眼镜替代智能手机的愿景,挑战iPhone的核心地位。
百度萝卜快跑与网约车巨头 Lyft 达成合作,明年在德英部署无人车
百度与全球出行平台 Lyft 达成战略合作,将于 2026 年在德国和英国部署萝卜快跑第六代无人车。这一举措标志着百度在无人驾驶领域的全球化战略的重要里程碑。对于欧洲市场而言,这意味着将迎来数千辆无人驾驶汽车,挑战传统驾驶模式中的安全性、可靠性以及隐私保护问题。此次合作也反映出百度加速全球布局的决心,并计划通过与伙伴的合作不断扩大无人驾驶出行服务的规模。
高德地图2025发布:“小高老师”上线,可像人一样理解需求
高德地图于2023年8月4日宣布全面AI化,推出全球首个AI原生地图应用——高德地图2025。此次更新的核心是孵化出具备自主推理能力的出行生活智能体“小高老师”,实现全旅程AI服务。然而,引入此类高级智能体可能会引发用户对数据隐私和安全的担忧,因为需要更深入的个人信息分析以提供精准建议。此外,技术故障或系统误差可能影响导航准确性,用户体验的稳定性和可靠性有待进一步验证。
理想回应「碰撞测试」:卷入舆论争议属无心之举
8月3日,理想汽车针对“与乘龙卡车对撞测试”一事进行回应,澄清此次测试目的仅为验证i8的安全性能,并非针对其他品牌。理想强调测试中使用的东风柳汽乘龙二手卡车仅为壁障物,公司无意对其质量做出评价。此前东风柳汽称该行为已构成严重侵权并保留法律追诉权。此外,中国汽研也表示该项目不涉及其他品牌的评价,并将保留对恶意解读的平台和个人媒体的法律追诉权。
许愿成功:罗巍透露荣耀 AiMAGE 影像将支持 AI 辅助构图功能
IT之家报道,荣耀首席影像工程师罗巍在8月4日宣布,将优先实现用户心愿中关于图库和拍照应用的改进,其中包含对图库云删除逻辑和视觉浏览优化的需求。此外,他透露荣耀 AiMAGE 影像将支持 AI 辅助构图功能,类似于华为手机在拍摄过程中通过AI分析画面帮助用户调整构图的功能。目前尚未明确荣耀这项新功能的具体实现方式及适配方案。
OpenAI奥尔特曼"秀肌肉":GPT-5高效整合网络信息能力
8月4日,OpenAI CEO奥尔特曼在社交平台上展示了疑似GPT-5的截图,引发关注。他推荐科幻动画《Pantheon》,并通过新模型回应用户询问,显示该剧获得"烂番茄"满分好评。外界对GPT-5期望较高,认为其上下文处理能力将超过前几代,支持多模态输入。面对谷歌等竞争对手压力,OpenAI承受推出新一代旗舰模型的巨大挑战。信息显示,GPT-5已具备整合网络信息的能力,其评价内容与实际一致。
热门跟贴