1. 智谱AI推出语音识别与桌面输入法

智谱AI推出了GLM-ASR系列语音识别模型,并开源了相关技术,旨在提升用户的语音交互体验。同时,推出了桌面端的智谱AI输入法,支持语音转文字、翻译和文本改写等功能。

→早读课解读:语音技术与输入法融合,从云端服务延伸至本地生产力场景。

→行动建议:在需要高效文字输入与多语言处理的场景,可集成此类工具替代传统输入法,提升内容创作与沟通效率。

2. 灵光助手推出科普动画生成功能

通用AI助手“灵光”推出了全新的科普动画生成功能,旨在通过直观、生动的动画形式解释复杂的科学原理,提升学习效果。该功能覆盖多个核心科学与工程领域,并已融入对话功能,用户可即时触发获取动态解释。

→早读课解读:AI科普从文本转向动态可视化,降低了知识传递门槛。

→行动建议:在培训、教学或产品说明中,可用此功能自动生成解说动画,提升学习者的理解效率与趣味性。

3. Mistral开源高性能代码大模型Devstral 2系列

Mistral开源代码大模型Devstral 2系列,包含123B和24B两个版本,均支持256K上下文。模型在SWE-bench Verified上分别取得72.2和68.0的高分,性能达开源头部水平,同时模型体积显著小于同类竞品。

→早读课解读:高性能代码模型以更小体积实现更高效率,为开发者提供轻量化选择。

→行动建议:开发团队可基于此模型构建本地化代码助手,在确保低延迟与数据安全的同时,提升编程效率与代码质量。

4. 谷歌在Doppl应用中推出AI购物视频功能

谷歌在实验性应用Doppl中推出全新的购物发现功能,利用人工智能技术生成视频,展示真实产品,并根据用户的个人风格进行服装推荐。

→早读课解读:AI从静态产品展示转向动态视频推荐,实现个性化购物体验升级。

→行动建议:电商与零售业务可探索AI生成商品推荐视频,结合用户数据提供个性化导购,提升转化率与用户粘性。

5. 生成式AI媒体平台Fal获得1.4亿美元融资

生成式AI媒体平台Fal获得1.4亿美元新一轮融资,英伟达风投Nventures等机构跟投,公司估值达45亿美元,较数月前增长两倍。公司为开发者提供图像、视频和音频AI模型托管服务,客户包括Adobe、Shopify等企业。

→早读课解读:AI模型托管即服务受资本认可,为应用层企业降低技术使用门槛。

→行动建议:在开发需要AI生成能力的应用时,可考虑采用此类托管服务,快速集成图像、视频与音频生成能力,专注于产品实现而非模型部署。

6. OpenAI秘密测试新图像生成模型

OpenAI正在对两款代号分别为“Chestnut”和“Hazelnut”的全新图像生成模型进行小规模盲测,这标志着其在文本到图像领域的重要进展。

→早读课解读:头部AI公司持续迭代视觉模型,文生图领域的竞争与技术突破将加速。

→行动建议:关注模型发布与API接入机会,在需要高质量图片生成的业务中,及时测试新模型效果,保持技术领先性。

想要了解更多AI 行业资讯以及ChatGPT和AI绘画实战案例,欢迎加入我们的「互联网AI早读课」知识星球!

在这个星球,你可以更加系统的学习AIGC相关知识

1. ChatGPT和AI绘画(Midjourney+Stable Diffusion+Photoshop beta)基础+进阶全攻略;

2. ChatGPT和AI绘画最直接变现案例;

3. 与200+行业先行者链接,积累你的专属人脉资源;

4. 社群保姆级一站式服务,包教包会包讨论;

现在加入,立享99元早鸟价优惠,星球用户每涨100人,价格上调100元,直到恢复499元原价

这个风口抓不抓的住,就看你愿不愿意迈出第一步了!

越晚加入成本越贵!最后两个名额又要涨价了!

打开网易新闻 查看精彩图片