连发六款大模型！亚马逊云科技吹响万能模型“集结号”|亚马逊云科技|大模型|模态|知名企业|算法|集结号

日前，在re:Invent大会上，亚马逊云科技接连发布六款大模型，让2024年的大模型浪潮有了更加惊艳的压轴表现。

作为全球互联网、云计算和AI行业的领导者，亚马逊云科技连发六款大模型、全新AI服务器、芯片以及一揽子新技术，同时推出了任意转任意（Any-to-Any）万能模型，彻底改变了生成式AI的游戏规则，也前所未有地强化自身在AI领域的存在。

祭出“六脉神剑”，亚马逊云科技还有更大杀招

2020年GPT-3的面世正式引爆生成式AI浪潮，至今四年多时间过去，各类大模型层出不穷，但依然无法满足各行各业日益强劲、日益复杂的AI工业化需求。

亚马逊云科技发布的六款大模型分别面向不同场景、不同领域、不同用户：

Nova Micro：文本生成模型，效率高、延迟低、占用资源少，具有极高的经济性，适合纯粹的文字工作者；
Nova Lite：低成本多模态模型，具有30万token上下文窗口，可处理大约22.5万个单词、1.5万行计算机代码，或者30分钟视频素材，兼顾成本与功能，适合大多数普通用户；
Nova Pro：功能与Nova Lite相同，也拥有30万token上下文窗口，支持图文、视频素材分析，但性能和成本更加均衡，适合要求相对专业的广大用户；
Nova Premier：Nova系列性能最强的多模态模型，但定位是“教师”而非独立使用模型，可通过知识蒸馏技术来指导和提升一个更简单、更易于部署的学生模型的性能与精度。
Nova Canvas：图片生成模型，支持生成和编辑图片，提供配色方案和布局控件，适合图片设计师或图文工作者，其内置的安全控件能够生成可追溯性水印，从而限制用户利用Nova Canvas生成有害内容；
Nova Reel：视频生成模型，现已支持生成时长6秒的视频，即将推出可生成2分钟视频的版本。

这六款大模型覆盖了文字、图片、视频等主要内容生成领域。在2024年的最后一个月，祭出六款大模型的亚马逊云科技，让我们看到了这位全球科技巨头的AI实力与野心。

（图源：re:Invent大会）

相较于“人有我有，人有我优”的6款大模型而言，我最期待的是亚马逊云科技计划明年中期推出的“大家伙”：一款语音转语音模型，以及一款任意转任意（Any-to-Any）万能模型，可输出、文本、图片、音频、视频等任何模态的内容。

亚马逊云科技AI和数据副总裁Swami Sivasubramanian曾表示，暂时没有任何一款大模型可以统治世界，亚马逊云科技一半以上的客户，会针对不同应用场景选择不同的大模型。

的确，一款能够完成任何任务的万能模型，不论是训练还是推理，所需算力都将无比庞大。从技术难度与成本两方面考虑，放眼整个AI大模型行业，也没有多少企业能够构造出“万能模型”。可一旦真的有企业成功打造出这样一款万能模型，能够一站式输出全模态内容，无疑也将彻底改变AI行业的秩序。

万能大模型的到来，将彻底释放人类的创意，所有个体与组织都可在万能模型的帮助下任意自由创作图文、视频、音乐，基于万能大模型也将出现万能AI应用，一款大模型统治世界也就不再遥不可及。

有实力打造万能大模型的巨头有且只可能是世界级科技巨头，而亚马逊云科技正是其中之一。

亚马逊云科技吹响了“万能模型”的集结号

算力是大模型的基础，能输出任意内容的万能大模型，所耗算力将远超所有，这正是亚马逊云科技打造万能大模型的底气。作为世界云计算的开创者、领导者与AI技术的佼佼者，亚马逊云科技拥有庞大的算力规模和雄厚的技术底蕴。

在re:Invent大会上，亚马逊云科技推出了由Trainium2芯片驱动的Amazon EC2 Trn2实例（可理解成AI云服务），其专为大语言模型和潜在扩散模型的生成式AI高性能深度学习而打造；而集成了64颗Trainium2芯片的AI服务器Trn2 UltraServer，则能支持万亿参数的AI大模型实时推理。相较于当前由GPU驱动的EC2实例性价比提升了30%-40%。

亚马逊云科技还发布了新一代AI训练芯片Trainium3，其基于3nm制程工艺，实现了性能翻倍，能效提升40%；搭载Trainium3芯片的UltraServer，性能预计比Trn2 UltraServer高出4倍。亚马逊云科技正在不断强化AI芯片布局，成为打破英伟达算力霸权的实力挑战者。

（图源：亚马逊云科技）

亚马逊云科技还与Anthropic洽谈合作，正在构建名为Project Rainier的Trn2 UltraServers EC2 UltraCluster，芯片规模可达数十万颗，将成为世界上最大的AI计算集群。

（图源：亚马逊云科技）

众所周知，云计算具有显著的规模效应，AI计算也是如此。从AI服务器到AI芯片再到超级计算集群，亚马逊云科技正在努力打造巨量规模的AI算力基础设施，显著提高AI计算效率、显著降低AI计算成本，给万能大模型构建了算力基座。

要打造万能大模型，不能只靠算力，AI技术同样重要，不只是大模型算法，还有适配AI大模型的网络、存储、调优、工具等技术，而亚马逊云科技，早已拥有领先的全栈AI技术。

在这一次在re:Invent大会上亮相的Trainium2 UltraServer采用的就是新一代AI网络结构tnp10，为数千台服务器提供数十PB网络容量的同时，延迟仅为10微秒，给运行参数量庞大的万能大模型提供了可能。

亚马逊云科技还在re:Invent大会上推出了自动推理检查、多Agent协作、模型蒸馏三大新功能，其中自动推理检查可验证大模型生成结果的准确性，提高推理结果的精度。

（图源：亚马逊云科技）

多Agent协作则面向企业用户，企业可在Bedrock上建造母项目，再将子项目分配给其他Agent推理计算，最终将不同Agent生成的内容整合输出。原先可能需要1周时间才能完成的任务，在多Agent协同功能的加持下，1个小时内就能完成推理。

模型蒸馏功能主要用于训练小模型，尽管小模型的精度和功能性会有损失，但是参数量大幅减少，可节省一定的资源，提升响应速度，更适合边缘计算、端侧AI、智能制造等特定场景。

亚马逊云科技还升级了Amazon Q Developer辅助编程平台、与NVIDIA联手打造Blackwell架构P6实例、升级数据管理系统，并推出了全新数据中心组件。

一切的一切，都在给万能大模型的到来打好基础。万事俱备只欠东风，面向下一个生成式AI阶段，亚马逊云科技已经准备好了。亚马逊云科技这家全球AI科技巨头的雄心壮志，已然浮出水面：探索AI的终极形态。

Any-to-Any将是通用AI大模型的终极形态

大模型当前百花齐放，有开源与闭源区别，有不同规模区别，还有通用型大模型和垂类大模型的划分，其中垂类大模型是指针对特定场景和用途训练的大模型，仅能解决对应性问题。我们日常所谈的头部大厂的大模型属于通用大模型，比如文心、豆包、通义、星火等等。

国内外诸多AI巨头在结束“大模型卷参数”后，已将重点放在大模型落地上，比如Apple Intelligence以及国内手机厂商的AI Agent，就是AI大模型在硬件产业的落地形态。

至于说大模型本身，当前很多科技巨头认为技术已经差不多了，很少有巨头提出要打造万能大模型的想法，甚至部分玩家如百度还明确提出了不做视频大模型——自然也不可能做万能模型了。

不过，也有不少玩家在丰富大模型的多模态能力，比如华为的盘古大模型，OpenAI的GPT-4等，都在丰富功能向“更全能”方向发展。

亚马逊云科技志向更加远大，在通过更高性价比的算力方案助推大模型落地应用的同时，积极探索万能大模型这一终极形态，让“输入任意模态信息与输出任意模态结果”的超级AI成为可能。

其实很多科技巨头不是不想做万能大模型，而是不能。在技术能力、算力资源的掣肘下，大多数通用型大模型甚至不支持输出音频和视频，但亚马逊云科技这一次推出的六款大模型，就已实现多模态内容输出，比如Nova Reel模型，生成视频长度即将达到2分钟，在行业属于领先水平。亚马逊云科技的AI算力与技术实力，足以让大多数AI公司艳羡。