什么是Amazon SageMaker:特点,使用案例和学习资源
amazon sagemaker可以让您为几乎任何用途开发、训练和运行机器学习模型,无论是商业目的、技术实验还是学术项目!
在机器学习项目中使用不同的工具会产生兼容性或同步问题。为了克服这些障碍,it巨头们正在竞相开发一种统一的软件即服务(saas)产品,您可以在其中执行所有机器学习项目任务,而无需更换应用程序。其中一个工具就是amazon sagemaker,它运行良好。
什么是amazon sagemaker?
amazon sagemaker托管在亚马逊网络服务(aws)公共云上,是一个用于所有机器学习事务的托管基础设施。它允许您在商业、教育和技术实验中创建、训练和部署用于预测分析应用程序的机器学习模型。
即使对于最有经验的开发人员来说,创建、训练和部署机器学习模型也是具有挑战性的。另一方面,amazon sagemaker旨在通过利用常见算法和其他工具简化这个复杂的过程,以加快机器学习工作流程。
使用amazon sagemaker的优势
amazon sagemaker的主要优势是它是一个完全托管的机器学习平台,涵盖了机器学习的a到z中的所有内容。您只需提供数据,就可以获得一个可用于生产的机器学习模型。您无需担心硬件、软件和网络。此外,它的正常运行时间非常好,因此您无需浪费时间进行故障排除。
其他值得注意的优点如下:
- 它提供了20个不同的机器学习开发模块。您可以选择您需要的模块,只需支付相应费用。例如,如果您已经拥有jupyter笔记本,则无需订阅此平台的基于云的jupyter笔记本。
- 该平台在机器学习框架上非常灵活。您可以使用mxnet、tensorflow和pytorch等框架进行工作。
- 对于模型训练,它提供了预配置的算法,用于监督学习、无监督学习和强化学习。但是,您也可以通过编写自己的自定义docker镜像来创建和运行自定义算法。
- 您可以通过包括预处理和后处理步骤以及原始数据来创建一个机器学习工作流,并在预定的日期和时间运行它。
- 您可以在混合云基础架构上部署机器学习模型。因此,当最终用户使用机器学习工具时,您可以减少托管成本,并将模型最安全地存储在本地服务器上。
- amazon sagemaker与亚马逊s3、dynamodb、亚马逊ec2、cloudwatch等所有其他aws产品集成。
- 它提供了面向数据科学家、机器学习工程师和业务分析师的使用案例,包括代码、低代码和无代码。
- 由于amazon sagemaker照顾了机器学习模型开发的许多方面,您可以使用较少的人力和资源创建解决现实场景的机器学习工具。
接下来,我们将讨论amazon sagemaker的使用案例。
amazon sagemaker的使用案例
sagemaker适用于自动驾驶汽车、媒体和娱乐、零售、销售和市场营销、仓储管理、供应链管理、物流、基于车队的交通、公用事业等行业的机器学习开发和扩展。
主要的实际应用案例如下:
- 为销售预测、需求预测或欺诈检测等任务构建预测模型
- 为内容审核、医学图像分析和物体识别等应用创建图像分类模型
- 在nlp应用中,利用sagemaker进行情感分析、文本分类和语言翻译
- 开发个性化内容、产品推荐和电影建议的推荐引擎
amazon sagemaker的ml部署功能
#1. 自动模型调优
amazon sagemaker的自动模型调优也称为超参数调优。它自动优化ml模型的超参数。
#2. 自动驾驶
自动驾驶是一个端到端的自动化功能,用于从开始到部署的ml模型生命周期。您提供数据集,autopilot分析数据集以生成多个模型候选项。它还按性能对ml模型进行排名。
#3. ml预测画布
画布是最适合新手ml工程师和业务分析师的图形用户界面(gui),他们希望生成准确的ml预测而无需编码。您可以选择现成模型和自定义模型。
#4. data wrangler
它提供了一个带有300多个内置数据转换器的gui。因此,您可以轻松处理各种数据类型,并应用过滤、聚合和特征工程等操作。
#5. debugger
amazon sagemaker debugger提供自动化的ml训练故障排除。它能够快速识别并通知您有关典型训练问题的警报,例如过多或不足的梯度值。这些警报可在amazon sagemaker studio中访问。
#6. rstudio ide
它是一个专为基于r的数据科学和机器学习任务定制的综合集成开发环境(ide)。它提供了一个用户友好的界面,用于r编程、数据可视化和ml模型构建。
#7. ml ci/cd的管道
管道是一个强大的工具,可以实现端到端的机器学习工作流程编排和自动化。它通过允许您使用gui或cli创建、可视化和管理工作流程,简化了构建、训练和部署ml模型的过程。
#8. 特征存储
在ml项目中,您将结构化数据集合并为ml模型训练的特征。使用特征存储,您可以存储各种ml开发项目的特征。将来,如果您正在开发类似的ml模型,可以重用这些特征。
#9. 分布式训练库
它使您能够使用分布式计算资源来减少训练机器学习模型所需的时间。这些库包括tensorflow,pytorch和apache mxnet。
#10. 机器学习模型部署
它简化了将机器学习模型部署到生产环境的过程。它让您将训练好的模型创建为实时推理的托管端点。该工具还支持a/b测试和金丝雀部署。
如何使用amazon sagemaker
首先,您必须访问“开始使用sagemaker”门户网站,在aws上设置您的根或iam用户账户。该门户网站将收集您的身份和安全详细信息以进行验证。验证后,您需要添加信用卡进行1美元的授权保留,并获得对amazon sagemaker免费套餐的访问权限。只有在超出免费套餐限额时才需要支付费用。
一旦进入,您需要按照以下步骤使用sagemaker来开发机器学习模型:
- 创建一个sagemaker笔记本实例来开发和测试机器学习模型。
- 在处理原始数据后,将结构化数据上传到sagemaker内置数据存储或amazon s3中。
- 从sagemaker选择一个特定于机器学习任务的预构建算法,或自己带入算法。
- 使用sagemaker笔记本编写模型训练代码。
- 训练完成后,使用sagemaker将您的模型部署为一个端点。这样可以通过api访问您的模型进行推理。
- 通过向sagemaker端点发送推理请求来测试您部署的模型。
- sagemaker提供了用于监控模型性能并根据流量自动缩放部署端点的工具。
接下来,让我们了解一下amazon sagemaker的安全功能。
amazon sagemaker的安全功能
当您查看aws的云安全白皮书时,您会发现sagemaker非常安全。根据这份statista报告,aws是领先的云服务提供商,市场份额达32%。因此,云安全是aws的高优先级。
它使用以下策略来保护您在sagemaker上的数据和机器学习模型:
- ml存储卷通过静态加密和安全组进行保护
- aws sagemaker对静态加密和传输中的ml模型工件进行加密
- 身份和访问管理技术允许员工或承包商基于角色进行访问
- amazon s3用于ml工件托管,并与sagemaker工具集成的aws kms用于安全的ml模型访问
- 还可以使用privatelink和aws的virtual private cloud进行增加的安全性
现在,我们将讨论amazon sagemaker的定价。
amazon sagemaker的定价
以下是云上sagemaker自我管理的机器学习基础架构的定价计划:
#1. amazon sagemaker免费套餐
- 免费使用sagemaker的功能,如studio notebooks,rstudio,data wrangler,feature store,canvas等,可以选择特定的小时或单位
- 前两个月提供增强的限制
- 前六个月减少对资源的免费访问
#2. 按需定价
- 选择sagemaker的15种不同服务,如studio notebooks,processing,tensorboard,feature store,data wrangler,real-time inference等,按使用情况付费
- 根据你喜欢每小时的价格选择计算资源,如vcpu和内存
#3. sagemaker储蓄计划
- 适用于同时处理多个ml模型的大型和企业业务
- 根据持续使用情况通过承诺单位支付固定价格,如每小时$x
学习资源
在线课程
#1. 亚马逊sagemaker基础知识:udemy
如果你计划将亚马逊sagemaker作为业务中所有即将进行的ml开发和扩展项目的托管ml平台,那么你必须注册参加这个udemy的亚马逊sagemaker基础知识课程,以获得对该平台的完整和简单的介绍。有1.5小时的按需培训视频讲座,您可以在电视、电脑或智能手机上观看。完成后,您还将获得证书。
#2. aws sagemaker初学者实用指南:udemy
如果您希望学习亚马逊sagemaker算法,如xgboost,linear learner,image classification和pca,那么这个udemy课程对您非常合适。您还可以学习自动机器学习和sagemaker studio。
所有的培训都通过6个真实的ml项目进行,因此您可以获得完整的实践经验。除了课程完成证书外,您还可以获得可下载的资源、终身访问权和按需培训视频,以便自主学习。
#3. aws认证机器学习专家:udemy
如果您正在参加aws认证机器学习专业认证 [mls-c01],那么这是udemy上必备的在线学习资源。它会对考试的各个主题进行培训,如aws计算、数据库、存储、机器学习、数据工程、建模等。在建模部分,课程还对amazon sagemaker进行了全面的讨论。
#4. 亚马逊sagemaker和azure ml:coursera
如果你是开发人员、数据科学家或ml工程师,希望探索mlops领域,可以参考coursera上关于亚马逊sagemaker和azure ml的在线学习课程。在这里,你将学习来自该领域专家的最新概念。
可以培养具备功能性mlops技能,从而在相关行业中获得高薪工作。
#5. 使用amazon sagemaker进行目标检测:coursera
您是否已经在使用amazon sagemaker开发机器学习解决方案?您想要探索使用机器学习进行目标检测的领域吗?那么,coursera上的这门关于amazon sagemaker的目标检测课程可以帮助您。它逐步展示了如何准备用于目标检测的数据。此外,它还解释了如何训练模型并在sagemaker上部署训练过的机器学习模型。
#6. amazon sagemaker:edx
如果您不是数据科学或机器学习开发背景,但想要学习如何在您的业务或专业应用中集成机器学习模型,那么您必须立即访问edx的学习资源。
专家将通过sagemaker笔记本、sdk、算法、应用集成等功能元素指导您进行应用和机器学习集成。每个课程部分都配有测验、笔记和更多学习资源。
#7. aws sagemaker:great learning
这门免费的great learning课程是一个中级课程,旨在学习如何使用amazon sagemaker等托管机器学习基础设施进行全方位的机器学习开发和部署。
在线课程包括aws云计算、sagemaker架构、aws sagemaker工具、机器学习以及使用aws进行机器学习的实践项目。成功完成后,您将获得great learning的可共享证书。
书籍
#1. 学习amazon sagemaker
本书将引导您了解amazon sagemaker的所有功能,从最基础的功能到高级功能。
预览 | 产品 | 评分 | 价格 | |
---|---|---|---|---|
|
学习amazon sagemaker:为开发人员和数据科学家构建、训练和部署机器学习模型的指南 | $29.99 | 在亚马逊购买 |
你将会了解内置的算法和框架,还会学习如何编写自定义算法来构建独特的机器学习模型。最终,你将重新发现自己作为一个全能的机器学习工程师,能够利用该平台进行机器学习的扩展、自动化和部署。
#2. amazon sagemaker机器学习食谱
如果你是一个机器学习初创公司的所有者或者实习的机器学习工程师,你必须阅读这本amazon sagemaker机器学习食谱。
预览 | 产品 | 评级 | 价格 | |
---|---|---|---|---|
|
amazon sagemaker机器学习食谱:80个经过验证的数据科学家和开发者执行机器学习实验和部署的食谱 | $31.72 | 在亚马逊上购买 |
通过研究80多个经过验证的机器学习项目,它将帮助你获得开发、测试和部署机器学习模型的实践经验。同时,还有逐步说明来帮助你从头开始使用amazon sagemaker构建这些模型。
#3. amazon sagemaker最佳实践
这本amazon书籍从高级介绍amazon sagemaker的特性和功能开始。因此,你可以将这些功能与机器学习过程的不同阶段进行对齐。
预览 | 产品 | 评级 | 价格 | |
---|---|---|---|---|
|
amazon sagemaker最佳实践:在amazon sagemaker上构建成功的机器学习解决方案的经过验证的技巧和窍门 | $29.99 | 在亚马逊上购买 |
你将获得实践洞察力,以解决数据科学挑战,包括大规模数据处理、数据准备、连接到大数据管道、检测数据偏差、进行a/b测试、提高模型可解释性等,这些都在amazon sagemaker上进行。
结论
到目前为止,你已经了解了amazon sagemaker是什么,它的特点使其成为一个全面的机器学习开发平台,并且还有一些学习资源,以充分利用它。
现在就给amazon sagemaker一个完整的机会,用于即将到来的机器学习项目,并亲自体验其中的差异。
你可能也对更多的机器学习基础设施平台感兴趣,以部署你的机器学习模型。