文/杨剑勇

作为全球云计算产业的开拓者与探路者,亚马逊云科技的每年的re:Invent全球大会都是全球云计算创新风向标。自2012年开始举办re:Invent全球大会,至2024年已有13年历史。

打开网易新闻 查看精彩图片

因每年re:Invent上,亚马逊云科技都会在大会上宣布推出大量突破性的新技术新服务,是全球云计算前沿趋势大会。值得注意的是,在2024 re:Invent全球大会,亚马逊云科技推出了令人眼花缭乱且数量惊人的新技术发布,与其他AI公司的发布形成鲜明对比,堪称是全栈联动式的大规模更新。

在生成式AI领域,亚马逊云科技全面强化基础设施、模型和应用三层技术栈,帮助企业更轻松、更经济地将生成式AI应用于实际业务场景。

亚马逊云科技的生成式AI的三层技术栈再次得到强化,底层的Amazon Trainium2率先出场,64颗芯片互联的超级服务器亦被搬上主舞台;Amazon Bedrock的模型选择范围极大扩展,着眼于成本、性能和速度的核心指标一系列新功能让人印象深刻,Amazon SageMaker AI的四项创新让模型训练变得更快更省钱;Amazon Q Developer进步神速,三款新智能体丰富了开发者的使用场景,新的转型功能则将彻底改变传统工作负载的现代化迁移进程。

从模型工具来看,拥有多元化的选择及更加低成本

2024 re:Invent全球大会上,亚马逊云科技推出了Amazon Nova六款基础模型,开启低成本高性能时代。其中,Nova Micro、Lite、Pro以及专注于生成高质量图像的Nova Canvas、擅长创作高清视频的Nova Reel等模型,一经推出便在行业内引发强烈关注。特别值得一提的是,在各自对应的智能应用细分领域,Nova Micro、Lite和Pro相较于Amazon Bedrock平台中表现最为优异的模型,不仅成功将应用成本削减至少75%,同时还以卓越的运算速度,成为同类模型中的佼佼者,为企业大规模部署AI解决方案提供了极具性价比的选择。

同时,对Amazon Bedrock全方位优化升级。Amazon Bedrock平台迎来了具有里程碑意义的重大升级。一方面,其模型库得到了极大丰富,率先引入备受瞩目的Luma AI和poolside等前沿模型,并及时更新Stability AI的最新研究成果,同时借助全新上线的Amazon Bedrock Marketplace,为用户呈上多达 100 余种涵盖热门、新兴以及专业领域的多样化模型,全方位满足不同业务场景的独特需求。

另一方面,在推理性能优化方面,通过低延迟优化推理技术、模型蒸馏策略以及提示词缓存机制等一系列创新举措的落地实施,实现了推理准确性的显著提升、成本的有效控制以及响应速度的大幅加快;此外,通过整合GraphRAG 等先进的知识库功能,进一步挖掘数据潜在价值,提升数据利用效率;并且,凭借自动推理检查功能以及多智能体协作技术的创新性应用,切实增强了AI系统的安全性,有力推动智能体技术向前发展。

此外,Amazon Q拓宽业务边界。凭借其强大的功能特性,深度渗透至软件开发与商业应用的各个环节,Amazon Q为传统工作负载的转型升级开辟出一条全新的通途。具体而言,Amazon Q Developer全新推出三款智能体,它们能够自动化执行单元测试、文档编制以及代码审查等一系列复杂流程,并且通过与GitLab展开深度集成,进一步拓展了自身的应用场景,为开发团队带来前所未有的便捷体验。与此同时,针对Windows.NET、VMware和大型机等传统工作负载,Amazon Q专门打造了一系列转型功能,能够有效缩短转型周期、降低转型成本,助力企业快速实现业务现代化。

最后,Amazon SageMaker AI 助力模型快速落地。Amazon SageMaker AI 始终聚焦于为客户提供更加高效、便捷的模型构建、训练与部署服务。全新推出的 Amazon SageMaker HyperPod集成了诸如新训练配方功能、灵活训练计划设定以及任务治理等一系列先进特性,配合亚马逊云科技合作伙伴提供的热门AI应用,能够帮助客户以更快的速度开启流行模型的训练之旅,借助灵活训练计划的实施,最多可节省数周宝贵时间,同时将成本降低幅度高达40%,真正让模型从实验室走向实际应用场景的道路变得更加顺畅无阻。

从底层算力来看,全栈联动,夯实数字底座

作为全球云计算领域的开创者与引领者,亚马逊云科技始终坚守创新驱动发展的理念,在计算、网络、存储以及数据库等核心领域持续深耕细作,凭借自研芯片的卓越性能、前沿网络架构的高速互联、存储服务的高效优化以及数据库技术的创新突破,为各类复杂多样的工作负载提供坚如磐石的底层支撑,助力企业在数字化转型的道路上稳步前行。

其中,基于Amazon Trainium2精心打造的EC2 Trn2实例正式投入商用,一经亮相便展现出惊人的性价比优势,相较于当前市场主流的GPU实例,其性价比提升幅度高达30-40%,Trainium芯片续写传奇。

与此同时,配备64个Trainium2芯片的EC2 Trn2 UltraServers服务器震撼登场,可释放高达83.2Petaflops的超强浮点算力,这一算力水平相当于单一实例的四倍之多,为大规模、高强度的计算任务提供了澎湃动力。展望未来,采用更为先进的3纳米工艺制程的下一代 Trainium3芯片已进入紧锣密鼓的研发阶段,预计将于2025年末正式上线,届时有望使集群性能实现四倍的飞跃式提升,并在性能、能效以及密度等关键指标上树立全新的行业标杆。

同时,Project Rainier集群横空出世,凭借其集结的数十万个 Trainium2芯片,展现出了超越以往任何集群五倍以上的超强算力,为诸如科研探索、产业升级等需要大规模算力支持的领域开辟了全新的发展空间,助力前沿创新突破重重阻碍,实现跨越式发展。

最后

亚马逊云科技大中华区产品部总经理陈晓建表示:“亚马逊云科技是全球云计算的开创者和引领者,更是企业构建和应用生成式AI的首选,今年re:Invent全球大会的一系列重磅发布再次印证了这一点。我们不仅在云的核心服务层面持续创新,更在从芯片到模型,再到应用的每一个技术堆栈取得突破,让不同层级的创新相互赋能、协同进化。我相信,只有这样全栈联动的大规模创新才能真正满足当今客户的发展需求,加速前沿技术的价值释放,助力各行各业重塑未来。”

这次re:Invent推出很多重磅创新发布,广度和深度令人印象深刻,这充分体现了亚马逊云科技全栈创新联动的能力。亚马逊云科技CEO Matt Garman在其主题演讲中提到,“我们的创新速度比以往任何时候都要快,从而为客户提供构建所需的一切。我从未像今天这样对未来充满期待。我们正处于一个关键的时刻,我们所看到的创新数量令人难以置信。这些创新不仅来自亚马逊云科技的创新,来自客户、合作伙伴、企业以及初创企业的创新让人感到无比兴奋。现在正是创新的最佳时机,丰富而强大的工具集前所未有,将助力用户实现创新目标。”