上周在拉斯维加斯举行的AWS re:Invent 2024上,亚马逊网络服务(AWS)推出了一系列变革性的人工智能举措,包括与Anthropic合作开发世界上最大的人工智能超级计算机之一,推出Nova系列人工智能基础模型,以及提供Trainium2人工智能芯片,将自己定位为人工智能领域的强大竞争选手。
亚马逊首席执行官Andy Jassy强调了成本效益在生成式人工智能(GenAI)开发中的关键作用,强调了该产业对提供更好性价比的替代人工智能基础设施解决方案的需求日益增长。
Jassy在一段回顾视频中说:“我们从大约1000个正在构建或已经在AWS推出的GenAI应用程序中学到的一个重要教训是,这些应用程序的计算成本确实很重要,而且往往是决定你能不能做到的关键因素。”“到目前为止,我们所有人在GenAI的计算中只使用了一个芯片。人们渴望更好的性价比。”
Rainier项目
AWS宣布推出Project Rainier,这是一款由其Trainium芯片驱动的突破性“超级集群”超级计算机。这个庞大的集群将包含数十万个Trainium2芯片,提供的计算性能Exaflops是用于训练Anthropic当前一代人工智能模型的五倍多。
AWS Trainium芯片被定位为目前主导市场的英伟达GPU的直接竞争对手。Rainier项目将于2025年完成,可能会在规模和性能方面创造新的纪录。
这一消息已经让投资者兴奋不已,消息传出后,AWS的股价上涨了1%以上,达到近213美元。一个关键合作伙伴是人工智能初创公司Anthropic,价值180亿美元。AWS已向该公司投资80亿美元,Anthropic计划利用Rainier项目来训练其人工智能模型(延展阅读:)。这两家公司也在共同努力提高Trainium芯片的能力,这标志着研发工作的深度整合。
与此同时,AWS正在推进Ceiba项目,这是与Nvidia合作开发的另一个超级计算机项目。Ceiba项目将配备20000多个Nvidia Blackwell GPU,强调AWS使其AI基础设施产品多样化的战略。Rainier专注于Trainium芯片的采用,Ceiba强调了AWS与其他行业领导者合作支持不同AI工作负载的能力。
Amazon Nova,新一代基础模型
该公司推出了Nova系列基础模型,从轻量级的纯文本模型到更大、更高级的语言模型,以及旨在生成图像和视频的模型。
新的Nova模型将在AWSBedrock上提供,这是专用于构建GenAI应用程序的平台。
新型号包括:
Amazon Nova Micro(一种非常快速的文本到文本模型);
Amazon Nova Lite、Amazon Nova Pro和Amazon Nova Premier(可以处理文本、图像和视频以生成文本的多模态模型);
Amazon Nova Canvas(生成工作室质量级图像);
AWS Nova Reel(生成工作室质量级视频)。
AWS通用人工智能高级副总裁Rohit Prasad表示:“新Nova模型旨在帮助内部和外部构建商应对这些挑战,提供引人注目的智能和内容生成,同时在延迟、成本效益、定制、检索增强生成(RAG)和代理功能方面取得有意义的进展。”
亚马逊首席执行官Jassy称,该公司在其新的前沿模型上取得了“巨大”的进展,具有很强的竞争力,并且具有成本效益和速度:“它们比Bedrock的其他领先模型便宜75%,速度更快。它们是你在那里能找到的最快的模型。”他说,“Nova模型允许进行微调,越来越多的GenAI应用程序构建者希望使用自己的标签数据和示例对模型进行微调。它允许您进行模型‘提纯’,这意味着将大模型中的智能注入到较小的模型中,从而降低延迟和成本。”
为了解决幻觉和不准确的问题,AWS表示,Amazon Nova模型与Amazon Bedrock知识库集成在一起,擅长检索增强生成(RAG),使客户能够通过将响应建立在组织自己的数据中来确保最佳准确性。
Trainium获得升级
推动这些令人兴奋的发展的是AWS的Trainium2芯片,现在可以通过两种新的云服务获得。该公司宣布正式提供由AWS Trainium2驱动的AWS弹性计算云(Amazon EC2)实例,以及新的Trn2 UltraServers。
该公司表示,与当前一代基于GPU的EC2 P5e和P5en实例相比,这些实例的性价比提高了30-40%。Trn2实例配备了16个Trainium2芯片,可提供20.8 Petaflops的峰值计算,使其为训练和部署十亿参数LLM做好了准备。
新的EC2 Trn2 UltraServers具有通过NeuronLink互联连接的64个相互连接的Trainium2芯片。UltraServers的计算峰值高达83.2 Petaflops,是单个实例的计算、内存和网络的四倍。
展望未来,AWS推出了下一代AI芯片Trainium3。该芯片旨在加速更大模型的开发,并在部署过程中提高实时性能。AWS首席执行官Matt Garman在周二的主题演讲中透露,Trainium3将于明年上市,其速度将是现有Trainium2的两倍,同时节能40%。
包括苹果在内的主要行业参与者越来越多地采用Trainium芯片,这增加了该公司的发展势头。苹果公司机器学习和人工智能高级总监Benoit Dupin透露,计划将Trainium整合到苹果的人工智能技术平台Apple Intelligence中。
这些最新进展突显了AWS对其人工智能计划的双重方法:通过Trainium等专有技术进行创新,同时与Nvidia等老牌企业合作,提供全面的人工智能产品。随着AWS在人工智能计算领域的影响力不断扩大,其投资和合作似乎正在为重大的行业颠覆奠定基础。
热门跟贴