打开网易新闻 查看精彩图片

ChatGPT的高级语音模式即将于9月24日全面。最近泄露的代码显示,这项功能有望首先在移动应用程序上发布,而非网页版。

可灵AI最新发布的1.5版本更新,提升了视频生成的数量和质量,拓宽了AI在创意媒体领域的应用边界。画质大幅提升,支持10秒1080p高清视频。

过去的一天,国内外AI行业还有哪些热点?让乌鸦君带你一起看看吧。

大模型

1)ChatGPT高级语音模式或将于9月24日全面上线

ChatGPT的高级语音模式即将于9月24日全面。最近泄露的代码显示,这项功能有望首先在移动应用程序上发布,而非网页版。此外,有用户发现,相关FAQ已更新,并且标准语音模式的说明页面也发生了变化。

此前曾提到该功能将在秋季结束前向所有用户推出,但现在改为更模糊的“即将逐步推出”信息。

同时,macOS版ChatGPT的语音模式UI也有更新,原有的黑色圆形图标已被天空动画替代,并增加了快速语音选择按钮。目前只有四种语音,但界面设计显示未来可能支持更多语音。

2)奥特曼:o1仅仅是“推理模型的GPT-2”

OpenAI CEO奥特曼,暗示了o1满血版将在接下来几个月发布。奥特曼把o1在推理模型里的地位比作语言模型中的GPT-2阶段。

他表示,几年后人们将看到“推理模型的GPT-4”,不过最近几个月就会有重大改进,新范式的进步曲线非常陡峭。L2“推理者”与L1“聊天机器人”非常不同。不过最令人兴奋的是L3“智能体”会来的非常快。

3)“欧洲版OpenAI”发布首个多模态模型

法国AI初创Mistral AI发布了旗下首个多模态模型Pixtral,拥有120亿个参数,大小约为24GB,基于Mistral的文本模型Nemo 12B构建,能够回答与给定URL或base64编码图像相关的任意数量或大小的图片问题。

从网上流传的多项基准测试结果来看,Pixtral 12B的性能几乎全面碾压Phi-3 vision、Qwen2-VL 7B、Claude 3 Haiku、LLaVA-OV 7B。

4)米哈游AI大模型Glossa完成备案

根据上海市互联网信息办公室公告,上海市计已完成41款生成式人工智能服务备案。备案名单显示,米哈游旗下子公司上海米哈游秘法科技有限公司」的服务通过备案,模型名称为Glossa。

此前,米哈游创始人蔡浩宇曾在社交媒体上罕见发言,表示“AIGC已经彻底改变了游戏开发“:在未来,只有两类人在创造游戏方面才有意义。

/ 02 /

AI应用

1)可灵AI发布1.5版本 视频更稳更高清

可灵AI最新发布的1.5版本更新,提升了视频生成的数量和质量,拓宽了AI在创意媒体领域的应用边界。画质大幅提升,支持10秒1080p高清视频,文本响应度提升,审美提升,人物一致性加强,物体一致性改善。

 乌鸦AI日报:GPT高级语音模式24日上线,微软推出300亿美元AI基金
打开网易新闻 查看更多视频
乌鸦AI日报:GPT高级语音模式24日上线,微软推出300亿美元AI基金

2)字节推音乐生成器Seed-Music支持多样化输入和精确控制

最近,字节跳动推出了音乐创作新工具Seed-Music,让用户通过多种方式生成音乐,如文字描述、音频参考、乐谱甚至语音提示。这一模型结合自回归语言模型和扩散模型,生成高质量音乐作品,同时提供精确控制。用户可配乐歌词、改编旋律,甚至上传语音片段转化为歌声。

3)微软推出Copilot Pages AI协作工具

微软推出了Copilot Pages功能。据介绍,用户团队可以在Copilot Pages中进行协作、查询,将数据、文件和网络中的更多内容添加进入页面中。

除此之外,微软还正式为企业用户推出Copilot智能体,该智能体获得了OpenAI全新o1模型的支持,可以像虚拟员工一样自动执行任务。

4)阿里通义千问开源Qwen2.5系列模型:Qwen2-VL-72B媲美GPT-4

通义千问团队宣布开源Qwen2.5系列模型,包括通用语言模型Qwen2.5、Qwen2.5-Coder和Qwen2.5-Math,预训练在18T tokens数据集上,提升知识获取、编程和数学能力。

5)阿里CEO吴泳铭:通义千问API调用价格下降97%

阿里巴巴集团董事兼CEO、阿里云智能集团董事长兼CEO吴泳铭表示,“过去一年以来,通义千问API在阿里云百炼上的调用价格下降了97%,百万tokens调用花费最低已经降到5毛钱。”

投融资情报

1)海外AI tutor产品获得顶级美元基金数百万种子轮投资

豹料台报道,一家近期成立的AI tutor公司,获得全球顶级风险投资机构数百万美元投资,该公司名为Tomo。旗下产品主要针对语言学习领域,并面向美国市场,目前产品正在研发阶段。

2)原绿米研发总监创业,布局机器人电驱,获产业龙头投资

原Aqara绿米的研发总监邱文彬,已于今年4月份正式创业,成立了深圳尉尔智驱。新公司方向为机器人电机驱动控制产品。新公司获得了上市公司江特电机的投资,并且占股50%。

此前,邱文彬曾担任中兴微手机电视基带芯片项目软件负责人、中家院工业机器人项目负责人以及中车株洲所磁悬浮高速电驱动项目负责人。

3)微软和贝莱德将推出300亿美元AI基础设施基金

贝莱德和微软正在合作,与阿联酋的MGX投资公司一起,计划筹集300亿美元的私募股权资金,专注于投资人工智能领域的关键基础设施,如数据仓库和能源设施。

该投资计划主要在美国进行,部分资金也将投向美国的合作伙伴国家。合作伙伴包括Global Infrastructure Partners的Bayo Ogunlesi、贝莱德收购的基金管理公司、MGX投资公司以及英伟达。

/ 04 /

AI基础设施

1)2024AI智能体应用洞察半年报:AI类APP月活超6600万

2024年AI智能体应用半年报显示,AI类应用月活跃用户数超过6600万。

打开网易新闻 查看精彩图片

2)字节跳动:与台积电合作AI芯片一事不实

有知情人士透露,字节跳动正在计划与台积电合作,在2026年前量产自主设计的AI芯片,预计字节将预定数十万枚芯片的产量。

字节方面就此事回应《科创板日报》表示,报道不实,字节跳动在芯片领域确实有一些探索,但还处于初期阶段,主要是围绕推荐、广告等业务的成本优化,所有项目也完全符合相关的贸易管制规定。

整理/朗朗

PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。