AWS在中国地区上线Amazon SageMaker：可自动训练和构建机器模型|amazon|aws|sagemaker|算法

近日，全球云计算领导者AWS（亚马逊旗下云服务商）宣布，将在中国宁夏和北京两区域正式上线Amazon SageMaker。

据悉，Amazon SageMaker是一项完全托管的服务，可以帮助机器学习开发者和数据科学家对机器学习(ML)模型进行快速构建、训练和部署。SageMaker完全消除了机器学习过程中重复、繁琐的调试步骤，可以帮助用户在10分钟内训练出高质量机器模型。

机器学习的实施是一项非常复杂的工作，涉及大量数据试错流程。开发者和数据科学家首先必须对数据进行可视化、转换和预处理，这些数据才能变成算法可以使用的格式。

即使是简单的机器模型，企业也需要花费庞大的算力和大量的训练时间，并需要招聘专门的团队来管理包含多台GPU服务器的训练环境。

从选择和优化算法，到调节影响模型准确性的数百万个参数，训练模型的所有阶段都需要大量人力和金钱支撑。

Amazon SageMaker通过预置的Notebook、针对PB级数据集优化的常用算法，以及自动模型调优，大大降低了模型构建和训练的难度。并且，Amazon SageMaker显著简化和加快了模型训练过程，可以通过自动提供和管理基础设施来训练模型和运行推理。

同时，AWS宣布了多项重要功能和高级特性，让客户能够更轻松地构建、训练、调优和部署机器学习模型。这些功能包括：

面向机器学习的集成开发环境（IDE）：Amazon SageMaker Studio IDE为所有Amazon SageMaker功能和整个机器学习工作流提供了一个统一界面。为开发者提供了创建项目文件夹、组织Notebook和数据集，以及协作讨论Notebook和结果的功能。

Amazon SageMaker Studio使构建、训练、解释、检查、监视、调试和运行机器学习模型变得更简单、更快。

自动构建机器模型：Amazon SageMaker Autopilot是业内首个可以让开发者对其模型保持控制和可见性的自动化机器学习功能。

它会自动检查原始数据，应用特征处理器，挑选最佳算法集，训练多个模型，对它们进行调优，跟踪其性能，然后根据性能对模型进行排名。用户只需要少量时间便可以得到用于部署、性能优异的机器模型。

调试与分析：Amazon SageMaker Debugger用于调试和分析模型训练，提高准确性，减少训练时间，让开发者更好地理解模型。通过该工具在Amazon SageMaker中训练的模型将自动发出收集到的关键指标，这些指标可以在Amazon SageMaker Studio中查看，也可以通过Amazon SageMaker Debugger的API查看，为训练的准确性和性能提供实时反馈。

实验管理：Amazon SageMaker Experiments可以帮助开发者组织和跟踪机器学习模型的迭代。机器学习通常需要多次迭代，目的是隔离和衡量更改特定输入时的增量影响。这些迭代过程可能会生成数百个实验构件，如模型、训练数据和参数设置等。

Amazon SageMaker Experiments可自动捕获输入参数、配置和结果，并将它们存储为“实验”，以帮助开发者管理这些迭代。

AWS全球副总裁兼大中华区执行董事张文翎表示，AWS提供了广泛、深入的机器学习和人工智能服务。Amazon SageMaker在AWS中国（宁夏）区域和AWS中国（北京）区域上线，将帮助更多中国客户去除机器学习涉及的混乱和复杂性，让他们能够胜任构建、训练和部署模型的工作，以应对新的挑战。

目前，全球数以万计的客户正在利用Amazon SageMaker加快机器学习调试和部署，包括：Autodesk、Change Healthcare、拜耳、英国航空、盖洛普、松下航空电子和T-Mobile等等。

- END -