作者 | 叶二 编辑 | 魏晓

通义加入了文生视频赛道,国产Sora又新增了一位主力。

就在今日举行的2024云栖大会上,阿里云CTO周靖人宣布通义万相全面升级,并发布全新视频生成模型,可生成影视级高清视频,可应用于影视创作、动画设计、广告设计等领域。即日起,所有用户可通过通义APP及通义万相官网免费体验。

在现场,周靖人表示,在文生视频功能中,用户输入任意文字提示词,即可生成一段高清视频,支持中英文多语言输入,并可以通过灵感扩写功能智能丰富视频内容表现力,支持16:9、9:16等多种比例生成等等。

AI蓝媒汇也第一时间进行了体验。

提示词:我在云栖大会现场,看见AI爆发

 我在云栖大会现场,看见阿里云大“爆发”
打开网易新闻 查看更多视频
我在云栖大会现场,看见阿里云大“爆发”

从生成的视频上看,对于提示词的理解,还是很到位的,画面也比较流畅,同时,还配有声音,不过在具体到人物的动作上,则出现了拖影、模糊,在衔接上稍显不足。

提示词:一只猫跟一只狗,正在打闹。

 我在云栖大会现场,看见阿里云大“爆发”
打开网易新闻 查看更多视频
我在云栖大会现场,看见阿里云大“爆发”

光影效果很好,AI生成视频中,动物在运动时的影子也有了较为准确的变化,同时,有非常清晰的猫叫声。不过美中不足,猫在运动中,仿佛多了一只脚,在落地时与尾巴合体了。

整体来看,在相关场景、意境、画面等处理上,通义都完成得比较出色,并且能生成符合场景的声音。但在动作展示上,还有一些欠缺,这也是当前国产Sora所面临的同样问题。

值得注意的是,此次通义发布的全新视频生成模型,是目前市场上通用大模型中,首次直接放开公测。

随着通义万相视频生成模型的发布,通义大模型已覆盖文本生成、图像理解、视频理解、音频理解、图像生成、视频生成等全模态场景。

显然,自从去年4月发布以来,通义一直在快速迭代进化。

与此同时,阿里云也在本次云栖大会上进一步阐述了自己对AI时代的理解,以及向外界传递了自身将在AI时代扮演的角色。

阿里云CEO吴泳铭在现场表示,AI最大的想象力不在手机屏幕,而是接管数字世界,改变物理世界。

这意味着,AI要渗入到数字世界的方方面面,渗入到人类从生产、生活、娱乐等各个角落各个场景。而在这一过程中,阿里云以AI为中心,全面重构底层硬件、计算、存储、网络、数据库、大数据,并与AI场景有机适配、融合,加速模型的开发和应用,打造一个AI时代的最强AI基建。

当然,这也与竞争压力有关。

云计算的争夺早就进入白热化。虽说阿里云靠着先发优势,一直在市场上取得领先优势,但随着竞争对手的冲击,市场份额逐年降低。

2023年中国公有云IaaS市场数据显示,阿里云以21.31%的市场份额占据领先地位,而在2022年,这一数字则超过了30%。

同时进入到大模型时代,所有玩家都意识到,未来多年云计算的增长点,就在生成式AI和大模型等新技术上。竞争也再次加剧。

数据显示,2023年,中国AI公有云服务市场规模达126.1亿元人民币,同比增长58.2%。其中,百度智能云、阿里云以26.4%的市场份额分别获得并列第一,腾讯云、华为云分列三四位。四大云厂商市场份额合计占比超过90%。

再加上近一两年来迅猛发力,希望实现弯道超车的字节火山引擎,未来中国AI公有云服务市场的竞争,基本上就在这5个选手中展开,都是强手中的强手。

而关键就在于,谁能争夺更多的企业客户、争夺更多的开发者。

阿里云只有放大招。

在现场,通义大模型进行了基础模型升级,性能媲美GPT-4o,同时发布最强开源模型Qwen2.5系列,其中旗舰模型Qwen2.5-72B性能超越Llama 405B,并上架语言、音频、视觉等100多款全模态模型。

据了解,自从2023年8月开源以来,通义在全球开源大模型领域后来居上,成为开发者尤其是中国开发者的首选模型。截至今年9月中旬,通义千问开源模型下载量突破4000万,Qwen系列衍生模型总数超过5万个,成为仅次于Llama的世界级模型群。

这是在技术能力上。

阿里云再次当起了价格屠夫,宣布通义千问系列模型再度大幅降价。其中Qwen-Turbo价格直降85%,低至百万tokens 0.3元,Qwen-Plus和Qwen-Max分别再降价80%和50%。

打开网易新闻 查看精彩图片

这些都是当下面向B端,通义千问的主力模型。其中,Qwen-Plus推理能力追平GPT4,可应用于复杂任务,是效果、速度及成本均衡的最优选择,降价后,Qwen-Plus性价比达到业界最高,同等规模较行业价格低84%。

不止如此,阿里云百炼平台还为所有新用户免费赠送超5000万tokens及4500张图片生成额度。

这是在降低大模型调用门槛上,以推动大模型普惠化。用周靖人的话来说是,我们希望企业和开发者能以最低的成本做AI、用AI,让所有人都能用上最先进的大模型。

同时,AI驱动的阿里云全系列产品家族也完成了最新升级。

最新上线的磐久AI服务器,支持单机16卡、显存1.5T,并提供AI算法预测GPU故障,准确率达92%;阿里云ACS首次推出GPU容器算力,通过拓扑感知调度,实现计算亲和度和性能的提升;为AI设计的高性能网络架构HPN7.0,可稳定连接超过10万个GPU ,模型端到端训练性能提升10%以上;阿里云CPFS文件存储,数据吞吐20TB/s,为AI智算提供指数级扩展存储能力;人工智能平台PAI,已实现万卡级别的训练推理一体化弹性调度,AI算力有效利用率超90%。

这是在产品服务上。

等等,在迎接即将爆发的AI时代,可以清晰看见阿里云要打造最强AI基建这一战略的决心,其所有动作、产品、技术、服务等,均配套展开,且彼此并不是孤立的,而是协同的,以服务于企业和开发者能够更好更方便使用大模型的能力来创造新的价值,新的想象。

数据显示,现已有超过30万家企业客户接入了阿里云百炼平台,包括一汽、金山、猎聘、哈啰集团、国家天文台等众多知名企业和机构。

AI已经在逐步渗入到数字世界了,但这是个开始。

正如吴泳铭所说,AI发展速度已经超过任何历史时期,但当前依然处于AGI变革的早期。距离其“AI改变物理世界”的终极设想,显然还有较长路要走。

就看阿里云如何持续围绕AI基建,不断做文章了。

Lanmeih/今日话题

你期待通义的文生视频吗?

咱们评论区聊聊~