日前,在re:Invent大会上,亚马逊云科技接连发布六款大模型,让2024年的大模型浪潮有了更加惊艳的压轴表现。
作为全球互联网、云计算和AI行业的领导者,亚马逊云科技连发六款大模型、全新AI服务器、芯片以及一揽子新技术,同时推出了任意转任意(Any-to-Any)万能模型,彻底改变了生成式AI的游戏规则,也前所未有地强化自身在AI领域的存在。
祭出“六脉神剑”,亚马逊云科技还有更大杀招
2020年GPT-3的面世正式引爆生成式AI浪潮,至今四年多时间过去,各类大模型层出不穷,但依然无法满足各行各业日益强劲、日益复杂的AI工业化需求。
亚马逊云科技发布的六款大模型分别面向不同场景、不同领域、不同用户:
- Nova Micro:文本生成模型,效率高、延迟低、占用资源少,具有极高的经济性,适合纯粹的文字工作者;
- Nova Lite:低成本多模态模型,具有30万token上下文窗口,可处理大约22.5万个单词、1.5万行计算机代码,或者30分钟视频素材,兼顾成本与功能,适合大多数普通用户;
- Nova Pro:功能与Nova Lite相同,也拥有30万token上下文窗口,支持图文、视频素材分析,但性能和成本更加均衡,适合要求相对专业的广大用户;
- Nova Premier:Nova系列性能最强的多模态模型,但定位是“教师”而非独立使用模型,可通过知识蒸馏技术来指导和提升一个更简单、更易于部署的学生模型的性能与精度。
- Nova Canvas:图片生成模型,支持生成和编辑图片,提供配色方案和布局控件,适合图片设计师或图文工作者,其内置的安全控件能够生成可追溯性水印,从而限制用户利用Nova Canvas生成有害内容;
- Nova Reel:视频生成模型,现已支持生成时长6秒的视频,即将推出可生成2分钟视频的版本。
这六款大模型覆盖了文字、图片、视频等主要内容生成领域。在2024年的最后一个月,祭出六款大模型的亚马逊云科技,让我们看到了这位全球科技巨头的AI实力与野心。
(图源:re:Invent大会)
相较于“人有我有,人有我优”的6款大模型而言,我最期待的是亚马逊云科技计划明年中期推出的“大家伙”:一款语音转语音模型,以及一款任意转任意(Any-to-Any)万能模型,可输出、文本、图片、音频、视频等任何模态的内容。
亚马逊云科技AI和数据副总裁Swami Sivasubramanian曾表示,暂时没有任何一款大模型可以统治世界,亚马逊云科技一半以上的客户,会针对不同应用场景选择不同的大模型。
的确,一款能够完成任何任务的万能模型,不论是训练还是推理,所需算力都将无比庞大。从技术难度与成本两方面考虑,放眼整个AI大模型行业,也没有多少企业能够构造出“万能模型”。可一旦真的有企业成功打造出这样一款万能模型,能够一站式输出全模态内容,无疑也将彻底改变AI行业的秩序。
万能大模型的到来,将彻底释放人类的创意,所有个体与组织都可在万能模型的帮助下任意自由创作图文、视频、音乐,基于万能大模型也将出现万能AI应用,一款大模型统治世界也就不再遥不可及。
有实力打造万能大模型的巨头有且只可能是世界级科技巨头,而亚马逊云科技正是其中之一。
亚马逊云科技吹响了“万能模型”的集结号
算力是大模型的基础,能输出任意内容的万能大模型,所耗算力将远超所有,这正是亚马逊云科技打造万能大模型的底气。作为世界云计算的开创者、领导者与AI技术的佼佼者,亚马逊云科技拥有庞大的算力规模和雄厚的技术底蕴。
在re:Invent大会上,亚马逊云科技推出了由Trainium2芯片驱动的Amazon EC2 Trn2实例(可理解成AI云服务),其专为大语言模型和潜在扩散模型的生成式AI高性能深度学习而打造;而集成了64颗Trainium2芯片的AI服务器Trn2 UltraServer,则能支持万亿参数的AI大模型实时推理。相较于当前由GPU驱动的EC2实例性价比提升了30%-40%。
亚马逊云科技还发布了新一代AI训练芯片Trainium3,其基于3nm制程工艺,实现了性能翻倍,能效提升40%;搭载Trainium3芯片的UltraServer,性能预计比Trn2 UltraServer高出4倍。亚马逊云科技正在不断强化AI芯片布局,成为打破英伟达算力霸权的实力挑战者。
(图源:亚马逊云科技)
亚马逊云科技还与Anthropic洽谈合作,正在构建名为Project Rainier的Trn2 UltraServers EC2 UltraCluster,芯片规模可达数十万颗,将成为世界上最大的AI计算集群。
(图源:亚马逊云科技)
众所周知,云计算具有显著的规模效应,AI计算也是如此。从AI服务器到AI芯片再到超级计算集群,亚马逊云科技正在努力打造巨量规模的AI算力基础设施,显著提高AI计算效率、显著降低AI计算成本,给万能大模型构建了算力基座。
要打造万能大模型,不能只靠算力,AI技术同样重要,不只是大模型算法,还有适配AI大模型的网络、存储、调优、工具等技术,而亚马逊云科技,早已拥有领先的全栈AI技术。
在这一次在re:Invent大会上亮相的Trainium2 UltraServer采用的就是新一代AI网络结构tnp10,为数千台服务器提供数十PB网络容量的同时,延迟仅为10微秒,给运行参数量庞大的万能大模型提供了可能。
亚马逊云科技还在re:Invent大会上推出了自动推理检查、多Agent协作、模型蒸馏三大新功能,其中自动推理检查可验证大模型生成结果的准确性,提高推理结果的精度。
(图源:亚马逊云科技)
多Agent协作则面向企业用户,企业可在Bedrock上建造母项目,再将子项目分配给其他Agent推理计算,最终将不同Agent生成的内容整合输出。原先可能需要1周时间才能完成的任务,在多Agent协同功能的加持下,1个小时内就能完成推理。
模型蒸馏功能主要用于训练小模型,尽管小模型的精度和功能性会有损失,但是参数量大幅减少,可节省一定的资源,提升响应速度,更适合边缘计算、端侧AI、智能制造等特定场景。
亚马逊云科技还升级了Amazon Q Developer辅助编程平台、与NVIDIA联手打造Blackwell架构P6实例、升级数据管理系统,并推出了全新数据中心组件。
一切的一切,都在给万能大模型的到来打好基础。万事俱备只欠东风,面向下一个生成式AI阶段,亚马逊云科技已经准备好了。亚马逊云科技这家全球AI科技巨头的雄心壮志,已然浮出水面:探索AI的终极形态。
Any-to-Any将是通用AI大模型的终极形态
大模型当前百花齐放,有开源与闭源区别,有不同规模区别,还有通用型大模型和垂类大模型的划分,其中垂类大模型是指针对特定场景和用途训练的大模型,仅能解决对应性问题。我们日常所谈的头部大厂的大模型属于通用大模型,比如文心、豆包、通义、星火等等。
国内外诸多AI巨头在结束“大模型卷参数”后,已将重点放在大模型落地上,比如Apple Intelligence以及国内手机厂商的AI Agent,就是AI大模型在硬件产业的落地形态。
至于说大模型本身,当前很多科技巨头认为技术已经差不多了,很少有巨头提出要打造万能大模型的想法,甚至部分玩家如百度还明确提出了不做视频大模型——自然也不可能做万能模型了。
不过,也有不少玩家在丰富大模型的多模态能力,比如华为的盘古大模型,OpenAI的GPT-4等,都在丰富功能向“更全能”方向发展。
亚马逊云科技志向更加远大,在通过更高性价比的算力方案助推大模型落地应用的同时,积极探索万能大模型这一终极形态,让“输入任意模态信息与输出任意模态结果”的超级AI成为可能。
其实很多科技巨头不是不想做万能大模型,而是不能。在技术能力、算力资源的掣肘下,大多数通用型大模型甚至不支持输出音频和视频,但亚马逊云科技这一次推出的六款大模型,就已实现多模态内容输出,比如Nova Reel模型,生成视频长度即将达到2分钟,在行业属于领先水平。亚马逊云科技的AI算力与技术实力,足以让大多数AI公司艳羡。
(图源:亚马逊云科技)
如今,亚马逊云科技已吹响万能模型大战的集结号。25年,AI世界也将迎来革命性的Any-to-Any时刻。相信更多企业会加入万能模型的战争,而不是坐等亚马逊云科技的万能模型“统治世界”。
只剩不到一年的时间,让我们一起静候AI大模型的“超级大家伙”。
免责声明:前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。
#亚马逊云科技 #re:Invent2024 #2024亚马逊云科技re:Invent全球大会
热门跟贴