1.阿里巴巴通义实验室的CosyVoice语音生成大模型已升级至2.0版本,新版本通过双向流式语音合成技术,降低了合成延迟,并在发音准确性上取得了显著进展。

2.字节跳动旗下火山引擎发布豆包大模型家族全面升级,包括视觉理解模型,能同时处理文本和图像问题,提供准确回答,大幅降低开发流程复杂度。火山引擎还推出全域AI搜索和大模型记忆方案,助力企业智能化转型。

3.智谱公司成功完成30亿元人民币的新一轮融资,这笔资金将用于智谱基座大模型的研发升级,进一步提升其在复杂推理和多模态任务解决方面的能力。

4.OpenAI发布o1模型API全面开放,成本降低60%,具有更高可定制性,新增函数调用、开发者消息和图像分析等功能,实时API支持WebRTC,简化开发流程,降低价格,提供Python SDK支持。

5.谷歌发布AI图像生成工具Whisk,支持通过上传图像来生成新图像,无需复杂的文本提示。可以为图像的主题、场景和风格提供多张图像作为提示,或者使用谷歌自动填充的AI生成图像。

6.Meta最近推出了Leffa,一个开源的AI虚拟试穿框架,旨在通过生成新图像提升用户的穿衣体验。用户只需上传一张参考图片,系统便能生成新的穿搭效果,减少了因不合适而退换货的麻烦。

想要了解更多AI 行业资讯以及ChatGPT和AI绘画实战案例,欢迎加入我们的「互联网AI早读课」知识星球!

在这个星球,你可以更加系统的学习AIGC相关知识

1. ChatGPT和AI绘画(Midjourney+Stable Diffusion+Photoshop beta)基础+进阶全攻略;

2. ChatGPT和AI绘画最直接变现案例;

3. 与200+行业先行者链接,积累你的专属人脉资源;

4. 社群保姆级一站式服务,包教包会包讨论;

现在加入,立享99元早鸟价优惠,星球用户每涨100人,价格上调100元,直到恢复499元原价

这个风口抓不抓的住,就看你愿不愿意迈出第一步了!

越晚加入成本越贵!最后两个名额又要涨价了!