AI早知道｜智谱AI完成30亿元融资；字节推出豆包视觉理解模型

互联网早读课

2024-12-19 08:09 ·北京

1.阿里巴巴通义实验室的CosyVoice语音生成大模型已升级至2.0版本，新版本通过双向流式语音合成技术，降低了合成延迟，并在发音准确性上取得了显著进展。

2.字节跳动旗下火山引擎发布豆包大模型家族全面升级，包括视觉理解模型，能同时处理文本和图像问题，提供准确回答，大幅降低开发流程复杂度。火山引擎还推出全域AI搜索和大模型记忆方案，助力企业智能化转型。

3.智谱公司成功完成30亿元人民币的新一轮融资，这笔资金将用于智谱基座大模型的研发升级，进一步提升其在复杂推理和多模态任务解决方面的能力。

4.OpenAI发布o1模型API全面开放，成本降低60%，具有更高可定制性，新增函数调用、开发者消息和图像分析等功能，实时API支持WebRTC，简化开发流程，降低价格，提供Python SDK支持。

5.谷歌发布AI图像生成工具Whisk，支持通过上传图像来生成新图像，无需复杂的文本提示。可以为图像的主题、场景和风格提供多张图像作为提示，或者使用谷歌自动填充的AI生成图像。

6.Meta最近推出了Leffa，一个开源的AI虚拟试穿框架，旨在通过生成新图像提升用户的穿衣体验。用户只需上传一张参考图片，系统便能生成新的穿搭效果，减少了因不合适而退换货的麻烦。

想要了解更多AI 行业资讯以及ChatGPT和AI绘画实战案例，欢迎加入我们的「互联网AI早读课」知识星球！

在这个星球，你可以更加系统的学习AIGC相关知识：

1. ChatGPT和AI绘画（Midjourney+Stable Diffusion+Photoshop beta）基础+进阶全攻略；

2. ChatGPT和AI绘画最直接变现案例；

3. 与200+行业先行者链接，积累你的专属人脉资源；

4. 社群保姆级一站式服务，包教包会包讨论；

现在加入，立享99元早鸟价优惠，星球用户每涨100人，价格上调100元，直到恢复499元原价！

这个风口抓不抓的住，就看你愿不愿意迈出第一步了！

越晚加入成本越贵！最后两个名额又要涨价了！

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴