本篇文章5055字,读完约13分钟
亚马逊云服务在宁夏和北京推出 亚马逊网络服务公司(AWS)今天宣布,亚马逊SageMaker正式在由西方云数据运营的AWS中国(宁夏)地区和由哈洛新网络运营的AWS中国(北京)地区推出。 [2020年5月12日,北京]亚马逊网络服务公司(AWS)今天宣布,亚马逊SageMaker正式在由西方云数据运营的AWS中国(宁夏)地区和由哈洛新网络运营的AWS中国(北京)地区推出。Amazon SageMaker是一个完全托管的服务,帮助开发人员和数据科学家快速构建、培训和部署大规模的机器学习(ML)模型。亚马逊SageMaker在中国的推出还使中国客户获得了一系列新发布的工具,如灵活的笔记本电脑、实验管理、自动模型创建、模型调试和分析以及模型概念漂移检测,所有这些都打包在第一个集成开发环境(IDE)的亚马逊SageMaker工作室中。要了解更多关于亚马逊萨格马克,请访问:www.amazonaws/sagemaker/.
机器学习的实施是一项非常复杂的工作,涉及大量的试错,并且需要专业技能。开发人员和数据科学家必须首先对数据进行可视化、转换和预处理,然后数据才能成为算法用来训练模型的格式。即使对于简单的模型,企业也需要花费大量的计算能力和培训时间,并且可能需要招募一个特殊的团队来管理包含多个GPU服务器的培训环境。从选择和优化算法到调整影响模型精度的数百万个参数,训练模型的所有阶段都需要大量的人力和推测。然后,当在应用程序中部署训练有素的模型时,客户需要应用程序设计和分布式系统方面的另一套专业技能。此外,随着数据集和变量数量的增加,模型将变得过时,客户必须一次又一次地重新训练模型,让模型从新的信息中学习和发展。所有这些任务都需要大量的专业知识,并消耗巨大的计算能力、数据存储和时间成本。此外,由于没有完整的机器学习工作流工具,传统的机器学习模型开发方法复杂、昂贵。
亚马逊SageMaker消除了机器学习过程中每一步的繁重工作。Amazon SageMaker通过预设记事本、PB级数据集优化的通用算法和自动模型调整,极大地降低了模型构建和训练的难度。此外,Amazon SageMaker显著简化和加快了模型训练过程,并且可以通过自动提供和管理基础设施来训练模型和运行推理。与此同时,AWS最近宣布了一些重要的特性和高级特性,使客户更容易构建、培训、调整和部署机器学习模型。这些功能包括:
机器学习集成开发环境(IDE):亚马逊SageMaker工作室将机器学习的所有组件集中在一个地方。与使用集成开发环境(IDE)的软件开发一样,开发人员现在可以在Amazon SageMaker Studio中查看和组织源代码、依赖项、文档和其他应用程序资产,例如移动应用程序的图像。目前,机器学习工作流有大量组件,其中许多都有自己的独立工具集。亚马逊SageMaker工作室集成开发环境为所有的亚马逊SageMaker特性和整个机器学习工作流提供了一个统一的界面。Amazon SageMaker Studio为开发人员提供了创建项目文件夹、组织笔记本和数据集以及协作讨论笔记本和结果的能力。Amazon SageMaker Studio使构建、训练、解释、检查、监控、调试和运行机器学习模型变得更加容易和快捷。
弹性笔记本:亚马逊SageMaker笔记本提供了一键激活的具有二阶弹性计算能力的Jupyter笔记本。笔记本包含运行或重新创建机器学习工作流所需的所有元素。在此之前,要查看或运行记事本,开发人员需要在Amazon SageMaker中启动计算实例。如果他们发现需要更多的计算,他们必须启动一个新实例,转移笔记本并关闭旧实例。此外,由于Notebook与计算实例耦合,并且通常存在于开发人员的工作站上,因此其共享和迭代协作并不容易。亚马逊SageMaker笔记本提供了灵活的Jupyter笔记本,允许开发人员轻松增加或减少笔记本所需的计算能力(包括图形处理器加速)。这些调整在后台自动进行,不会中断开发人员的工作。开发人员不再需要浪费时间关闭旧实例并在新实例中重新创建所有工作,因此他们可以更快地开始构建模型。亚马逊SageMaker笔记本还可以自动复制特定的环境和库依赖关系,实现笔记本的一键式共享。这将使构建模型的协作变得更加容易。例如,一名工程师可以轻松地与其他工程师共享手头的工作,这样他们就可以基于现有的工作构建模型。
实验管理:亚马逊SageMaker实验帮助开发人员组织和跟踪机器学习模型的迭代。机器学习通常需要多次迭代,以便隔离和测量改变特定输入的增量影响。这些迭代过程可能产生数百个实验组件,例如模型、训练数据和参数设置。然而,开发人员目前缺乏方便的实验管理机制,甚至不得不依赖电子表格来跟踪实验并手动对这些组件进行排序,以了解相应的影响。Amazon SageMaker实验自动捕获输入参数、配置和结果,并将它们存储为实验,以帮助开发人员管理这些迭代。开发人员可以浏览活动的实验,根据特征搜索以前的实验,查看以前的实验结果,并直观地比较实验结果。亚马逊SageMaker实验公司还维护着一整套实验。如果一个模型开始偏离它的预期结果,开发人员可以及时检查它。因此,亚马逊SageMaker实验使开发人员更容易快速迭代和开发高质量的模型。
调试和分析:Amazon SageMaker调试器用于调试和分析模型培训,以提高准确性、减少培训时间并使开发人员更好地理解模型。目前,机器学习的训练过程基本上是不透明的,训练时间可能很长,难以优化。此外,它通常像一个黑盒,很难解释和解释模型。使用亚马逊SageMaker调试器,在亚马逊SageMaker中培训的模型将自动发送收集到的关键指标,这些指标可在亚马逊SageMaker工作室中查看或通过亚马逊SageMaker调试器的应用编程接口提供关于培训的准确性和性能的实时反馈。当检测到培训问题时,Amazon SageMaker调试器会提供警告和补救建议。亚马逊SageMaker调试器还可以帮助开发人员理解模型如何工作,向神经网络的可解释性迈出了第一步。
自动构建模型:Amazon SageMaker automation是业界第一个自动机器学习功能,它允许开发人员保持对模型的控制和可见性。当前机器学习的自动方法在创建初始模型方面做得很好,但是对于开发人员来说,没有关于如何创建模型以及模型包含什么的数据。因此,如果模型不符合预期,开发者别无选择,只能改进它。此外,目前的机器学习自动化服务只给客户一个简单的模型。有时,客户想要做出一些权衡,比如牺牲某个版本模型的一点准确性,以换取更低的延迟预测。但是,如果客户只有一种型号,则没有这种选择。Amazon SageMaker自动驾驶仪将自动检查原始数据,应用特征处理器,选择最佳算法集,训练多个模型,调整它们,跟踪它们的性能,然后根据它们的性能对模型进行排名。只需点击几下鼠标,用户就可以得到部署的最佳模型建议,这只需要一点时间和精力进行培训。此外,用户可以清楚地看到模型是如何创建的以及它包含了什么。缺乏机器学习经验的人可以使用亚马逊SageMaker自动驾驶仪轻松生成纯数据模型。有经验的开发人员可以使用它来快速开发基本模型,团队可以在此基础上进一步迭代。亚马逊SageMaker自动驾驶仪为开发人员提供了多达50种不同的模型,可以在亚马逊SageMaker工作室查看。因此,开发人员可以为应用场景选择最佳模型,并结合不同的优化因素考虑多个候选模型。
概念漂移检测:亚马逊SageMaker模型监视器允许开发人员检测和纠正概念漂移。影响在生产环境中部署的模型的准确性的主要因素之一是生产环境中的输入数据开始不同于模型训练中使用的数据集,从而影响预测结果。例如,经济条件变化引起的新利率将影响国内采购预测,季节变化将影响不同温度、湿度和空气体压力等条件下的设备维修计划预测。如果输入数据开始显示这种差异,就会导致所谓的概念漂移,即用于预测的模型不再适用。亚马逊SageMaker模型监视器自动检测模型部署中的概念漂移。Amazon SageMaker模型监视器在训练期间创建一组关于模型的基线统计,并将用于预测的数据与训练基线进行比较。当检测到漂移时,亚马逊SageMaker模型监视器会提醒开发人员,并帮助他们直观地确定原因。开发人员可以使用Amazon SageMaker模型监视器的开箱即用功能来立即检测漂移,或者他们可以为Amazon SageMaker模型监视器编写自己的规则来进行监控。亚马逊SageMaker模型监视器使开发人员更容易调整训练数据或算法来解决概念漂移问题。
越来越多的中国企业正在探索机器学习和人工智能技术的巨大潜力,以及如何将这些技术集成到他们的日常应用中。但事实上,除了少数拥有专业人才和数据科学家的企业之外,大多数公司仍然发现很难应用机器学习技术,因此客户希望我们能够使这项技术更加方便易用。AWS全球副总裁兼大中华区执行董事张文翊表示,AWS提供广泛而深入的机器学习和人工智能服务。亚马逊SageMaker在AWS中国(宁夏)和AWS中国(北京)的在线存在将帮助更多的中国客户消除机器学习中的困惑和复杂性,并使他们能够胜任构建、培训和部署模型以应对新的挑战。
全球成千上万的客户已经使用亚马逊SageMaker来加速机器学习的部署。Autodesk、Change Healthcare、拜耳、英国航空公司空、盖洛普、洛杉矶快船、松下航空电子、环球和邮件、T-Mobile等。中国客户如虎牙、大宇无限、嘉义互动娱乐和华来科技也选择了亚马逊萨格马克来大规模构建、培训和部署机器学习模型。
大宇无限是一家专门从事移动应用开发的公司,主要为中东、东南亚和拉丁美洲等新兴市场提供手机视频服务。大宇无限科技副总裁刘克东表示:实现大宇无限产品视频内容的在线推荐对我们的开发团队来说是一个巨大的挑战。构建机器学习系统的整个过程极其复杂,需要大量开发人员花很长时间来完成。Amazon SageMaker极大地简化了机器学习系统的构建、培训和部署过程,因此我们不需要构建基础设施。我们的算法工程师只需要为Amazon SageMaker准备数据,在三个月内就可以从零开始完成整个系统的构建,并且能够承受实际用户访问的压力。
借助AWS和亚马逊SageMaker提供的亚马逊EC2图形处理器实例,华莱科技以最佳成本将机器学习创新集成到其智能家居、智能安全设备和服务中。天津华来科技股份有限公司云业务部总监季保平表示:在AWS上,我们可以完成算法构建和模型训练,而且这个过程不需要我们在本地投资昂贵的计算硬件。一切都以按需方式在云中完成。与行业中常用的公共算法不同,更重要的是我们训练的模型在应用场景中有更多的个性化空并且我们对我们训练的模型拥有知识产权,这将是我们未来的核心竞争力。
AWS合作伙伴网络(APN)成员也对亚马逊萨格马克在中国的推出表示欢迎。
德勤数据是一个基于AWS的平台即服务平台,为企业客户提供数据分析和业务洞察。它为不同的行业和业务场景提供各种数据建模和预测服务。德勤创新与数字R&D中心的管理合伙人赖友友评论道:“通过亚马逊SageMaker,我们大大改进了算法和机器学习建模能力,并提高了分析效率。”亚马逊的集成开发环境平台也帮助我们加快了开发进程。
Iacrod是AWS的核心咨询合作伙伴。其基于AWS的解决方案大大减少了用户的开发时间和运营成本。微软中国区副总裁桂子杰表示:我们利用亚马逊SageMaker平台,加快企业导入行业人工智能解决方案,如标签、文本分析、语义理解、预测分类、推荐系统和欺诈检测等。我们定制端到端人工智能应用程序,真正解决客户遇到的业务问题。随着亚马逊SageMaker登陆中国,我们将利用SageMaker平台作为企业机器学习操作的核心,帮助企业构建机器学习操作流程,尤其是在金融行业,帮助内部数据科学家和人工智能工程师建立、培训和部署机器学习模型。
2020-03-24 13:07:50 云信息:中国云计算市场最新排名:阿里云第一,亚马逊成为第二 最近,英国研究机构Canalys在2019年第四季度发布了一份关于中国公共云服务市场的报告。该报告显示,阿里云排名第一,市场份额环比上升至46.4%。
标题:亚马逊云服务在宁夏和北京推出
地址:http://www.yunqingbao.cn/yqbxx/160.html