AI早知道｜智谱AI推出语音识别与桌面输入法；灵光助手推出科普动画生成功能

互联网早读课

2025-12-11 08:10 ·北京 ·优质互联网领域创作者

1. 智谱AI推出语音识别与桌面输入法

智谱AI推出了GLM-ASR系列语音识别模型，并开源了相关技术，旨在提升用户的语音交互体验。同时，推出了桌面端的智谱AI输入法，支持语音转文字、翻译和文本改写等功能。

→早读课解读：语音技术与输入法融合，从云端服务延伸至本地生产力场景。

→行动建议：在需要高效文字输入与多语言处理的场景，可集成此类工具替代传统输入法，提升内容创作与沟通效率。

2. 灵光助手推出科普动画生成功能

通用AI助手“灵光”推出了全新的科普动画生成功能，旨在通过直观、生动的动画形式解释复杂的科学原理，提升学习效果。该功能覆盖多个核心科学与工程领域，并已融入对话功能，用户可即时触发获取动态解释。

→早读课解读：AI科普从文本转向动态可视化，降低了知识传递门槛。

→行动建议：在培训、教学或产品说明中，可用此功能自动生成解说动画，提升学习者的理解效率与趣味性。

3. Mistral开源高性能代码大模型Devstral 2系列

Mistral开源代码大模型Devstral 2系列，包含123B和24B两个版本，均支持256K上下文。模型在SWE-bench Verified上分别取得72.2和68.0的高分，性能达开源头部水平，同时模型体积显著小于同类竞品。

→早读课解读：高性能代码模型以更小体积实现更高效率，为开发者提供轻量化选择。

→行动建议：开发团队可基于此模型构建本地化代码助手，在确保低延迟与数据安全的同时，提升编程效率与代码质量。

4. 谷歌在Doppl应用中推出AI购物视频功能

谷歌在实验性应用Doppl中推出全新的购物发现功能，利用人工智能技术生成视频，展示真实产品，并根据用户的个人风格进行服装推荐。

→早读课解读：AI从静态产品展示转向动态视频推荐，实现个性化购物体验升级。

→行动建议：电商与零售业务可探索AI生成商品推荐视频，结合用户数据提供个性化导购，提升转化率与用户粘性。

5. 生成式AI媒体平台Fal获得1.4亿美元融资

生成式AI媒体平台Fal获得1.4亿美元新一轮融资，英伟达风投Nventures等机构跟投，公司估值达45亿美元，较数月前增长两倍。公司为开发者提供图像、视频和音频AI模型托管服务，客户包括Adobe、Shopify等企业。

→早读课解读：AI模型托管即服务受资本认可，为应用层企业降低技术使用门槛。

→行动建议：在开发需要AI生成能力的应用时，可考虑采用此类托管服务，快速集成图像、视频与音频生成能力，专注于产品实现而非模型部署。

6. OpenAI秘密测试新图像生成模型

OpenAI正在对两款代号分别为“Chestnut”和“Hazelnut”的全新图像生成模型进行小规模盲测，这标志着其在文本到图像领域的重要进展。

→早读课解读：头部AI公司持续迭代视觉模型，文生图领域的竞争与技术突破将加速。

→行动建议：关注模型发布与API接入机会，在需要高质量图片生成的业务中，及时测试新模型效果，保持技术领先性。

想要了解更多AI 行业资讯以及ChatGPT和AI绘画实战案例，欢迎加入我们的「互联网AI早读课」知识星球！

在这个星球，你可以更加系统的学习AIGC相关知识：

1. ChatGPT和AI绘画（Midjourney+Stable Diffusion+Photoshop beta）基础+进阶全攻略；

2. ChatGPT和AI绘画最直接变现案例；

3. 与200+行业先行者链接，积累你的专属人脉资源；

4. 社群保姆级一站式服务，包教包会包讨论；

现在加入，立享99元早鸟价优惠，星球用户每涨100人，价格上调100元，直到恢复499元原价！

这个风口抓不抓的住，就看你愿不愿意迈出第一步了！

越晚加入成本越贵！最后两个名额又要涨价了！

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴