AI 工程训练营:使用 AWS SageMaker 构建、训练和部署模型
AI Engineering Bootcamp: Build, Train and Deploy Models with AWS SageMaker
通过本课程开始您的 AI 职业生涯,该课程将教您使用现实世界中使用的两个最重要的 AI 工具构建、训练和部署自己的 AI 模型:AWS SageMaker 和 Hugging Face。无需机器学习知识!
概述
学习使用 AWS SageMaker 构建端到端 AI 应用程序:从收集和准备您自己的数据,到训练和修改您自己的模型,再到将 AI 应用程序部署和扩展到现实世界中。
学习内容
- 构建并部署尖端的人工智能和机器学习模型到云端
- 通过 AWS SageMaker 利用 Hugging Face 中强大的预训练模型
- 通过深入了解 Transformer 架构、标记化等,揭开大型语言模型工作原理背后的数学秘密
- 使用 PyTorch 自定义模型以满足 AI 应用程序的需求,以创建独特的解决方案
- 训练和测试模型,确保它们每次都能提供准确的结果
- 了解监控和优化模型的最佳实践,包括负载测试和扩展以满足大量用户需求
什么是 AI 工程师?
简而言之,AI 工程师负责 AI 应用程序的整个生命周期,即以 AI 为核心的应用程序。AI 工程师采用 AI 模型(包括大型语言模型),并根据自己的需要对其进行自定义。
(如果您想要长版本,请在此处查看我们的博客文章)
这需要从使用自定义数据集构建模型,到训练和调整模型,再到使用云技术部署模型和扩展模型,无所不包。
这个角色像野火一样增长,但它仍在不断发展,毫无疑问,随着 AI 格局的变化,它将继续发展。
什么是 AWS SageMaker?
AWS SageMaker(也称为 Amazon SageMaker)是一项完全托管的机器学习服务,使您能够快速大规模构建、训练和部署机器学习模型。它消除了基础设施管理的繁重工作,因此您可以专注于有趣的部分 – 创建您自己的出色 AI 项目和应用程序!
简而言之,它是 AI 工程师、机器学习工程师、开发人员和数据科学家使用的领先真实 AI 工具之一。
想知道为什么 AWS SageMaker 真的很酷吗?
它允许以易于使用的方式进行端到端机器学习,无论您的技能水平如何!
因此,无论您是经验丰富的 AI 专家还是新手,SageMaker 都能提供直观的工具和用户友好的界面,让每个人都能使用机器学习。
如果您想构建和部署自己的 AI 应用程序,那么这里就是您的理想去处。
为什么选择这门课程?
嗯,因为它是最好、最新和最实用的在线 AI 工程训练营课程,它教您现实世界的 AWS SageMaker 技能,并让您动手实践,以便您可以在现实世界中实际使用您的技能。
但当然,我们是有偏见的。因此,以下是此 AWS SageMaker 课程的逐节细分,以便您自己决定:
1. 简介:概述您将在本课程中学习的内容,结识参加本课程的其他学生,并结识您的杰出导师:高级机器学习工程师 Patrik Szepesi!
2. 设置我们的 AWS 环境和最佳实践:我们将立即通过设置 AWS 账户、配置 IAM 安全角色和应用最佳实践来建立坚实的基础。您还将学习设置 AWS SageMaker 域、调整 UI 设置以及了解 SageMaker Studio 中的定价结构。
3.Amazon SageMaker 中的 HuggingFace 简要介绍:然后,您将获得将 HuggingFace 与 AWS SageMaker 集成的实用介绍。本节介绍如何使用 PyTorch 设置 SageMaker,以及为情绪分析等任务部署预构建的 HuggingFace 模型,包括自动扩展的注意事项。
4. 为我们的多类文本分类项目收集数据集:是时候动手学习如何为多类文本分类任务获取和准备数据集了。您将了解如何获取数据集、创建 S3 存储桶以及将数据有效地上传到 AWS。
5. 探索性数据分析:在本节中,您将进行探索性数据分析,以从数据集中发现见解,包括学习数据可视化技术和最佳实践,以更好地了解可能影响后续建模决策的潜在模式。
6.设置我们的培训笔记本:本实用部分可帮助您在 Amazon SageMaker 中设置培训环境,包括配置笔记本和使用 Python 为 HuggingFace 估算器编写脚本。这种设置对于高效的模型训练和迭代至关重要!
7. 分词和编码简介:这是一个很酷的部分。您将探索标记化和编码的基本 NLP(自然语言处理)过程,这些过程是 (大型语言模型) 等 LLMs AI 模型的基础。这些课程包括用于创建笔记本的动手活动、理解分词化词汇以及在模型训练中应用这些技术的实际示例。
8. 使用 PyTorch 设置数据加载:在这里,您将学习创建数据集加载器类和配置 PyTorch DataLoader,这是在模型训练期间高效处理大量数据的关键组件。
9. 选择你的路:是时候再来一次短暂的插曲了!这将为您接下来的高级主题做好准备,帮助您决定学习机器学习和 AI 模型的更深层次技术细节的路径。您可以决定是否要深入研究数学(我们知道你们中的一些人不喜欢数学,这没关系!
10. 大型语言模型和 Transformer 背后的数学:这个广泛的部分深入探讨了 Transformer 和大型语言模型的数学基础和工作原理,包括多头注意力、位置编码和注意力机制背后的理论。
11. 在 PyTorch 中自定义我们的模型架构:学习通过添加 dropout、线性层和 ReLU 激活来自定义 DistilBERT 模型。这种自定义是针对特定分类任务和数据集定制模型的关键。
12. 创建准确性、训练和验证函数:本节重点介绍创建准确、健壮的训练和验证函数,以确保模型得到正确评估并在各种条件下表现良好。
13. 优化器函数、模型参数、交叉熵损失函数:理解并实现优化函数,调整模型参数,并深入研究交叉熵损失函数的数学运算,这对于训练有效的机器学习模型至关重要。
14.训练和部署前可能出现的资源限制错误:为潜在问题做准备,本节将教您如何通过管理和请求增加 AWS 配额来处理资源限制错误。
15.启动我们的训练作业并在 AWS CloudWatch 中监控它:这越来越令人兴奋!因为在这里,您将在 SageMaker 中开始训练作业,并学习使用 AWS CloudWatch 监控和调试这些作业,从而深入了解模型的运行状况和性能。
16.在 SageMaker 中部署我们的多类文本分类终端节点:此关键部分介绍了将经过训练的多类文本分类模型部署为 Amazon SageMaker 终端节点,确保您了解使模型可用于实际应用程序的步骤。
17. 负载测试我们的机器学习模型:仅仅因为模型是实时的,并不意味着它会工作!您需要对已部署的模型执行负载测试,以评估性能和可扩展性,为它们为稳健高效的实际部署做好准备。
18.机器学习模型的生产级部署:本节将引导您完成在生产规模部署模型的步骤,包括设置 AWS Lambda 函数和 API Gateway,以及使用 Postman 等工具测试部署。这就是橡胶真正与道路相遇的地方!
19. 清理资源:最后但并非最不重要的一点是,我们需要清理东西,以确保您使用的是现实世界的最佳实践!本节重点介绍清理 AWS 资源以管理成本和维护高效云环境的重要性。
本课程为我准备哪些职业?
AI 和机器学习现在非常热门。如果您想赶上并驾驭 AI 浪潮,SageMaker 是一个很好的起点。这是一项用于人工智能前沿的大量热门职业的技能,包括:
AI工程师和机器学习工程师:专注于设计、开发和定制机器学习模型并将其部署到生产环境。需要具备模型训练、优化和部署方面的技能。
AI 专家:擅长使用人工智能技术和机器学习模型构建应用程序。
数据科学家:涉及分析和解释复杂数据以帮助公司做出明智的决策。需要数据准备、探索性数据分析和模型构建方面的专业知识。
AI 研究科学家:进行研究以推进人工智能和机器学习领域。需要对高级机器学习概念有深入的理解,包括注意力机制和大型语言模型。
云工程师:专注于设计、规划、管理、维护和支持云计算应用程序。需要了解 AWS 服务和云部署的最佳实践。
DevOps 工程师:通过自动化软件交付和基础设施变更流程,弥合开发和运营之间的差距。需要使用 AWS CloudWatch 等工具部署和监控机器学习模型的技能。
软件工程师:涉及开发软件应用程序,包括具有集成机器学习组件的应用程序。需要了解如何将机器学习模型集成到应用程序中,并确保其可扩展性和性能。
数据工程师:专注于构建和维护数据管道,确保数据干净、可靠并准备好进行分析。需要 AWS S3 等数据存储解决方案和数据准备技术的知识。
技术产品经理:管理技术产品的开发和部署,包括涉及机器学习的产品。需要了解 Machine Learning 部署和监控的技术方面。
我还应该了解什么?
成为 ZTM 会员后,您不仅可以访问我们所有的训练营课程、字节和项目。
但你也可以加入我们独家的实时在线社区课堂,与成千上万的学生、校友、导师、助教和讲师一起学习。
最重要的是,你将从具有实际经验的行业专业人士(Patrik)那里学习,他是一名AI和机器学习工程师。他会教你他在自己的角色中使用的确切策略和技巧。
最后,与所有 ZTM 课程一样,这门课程是一个有生命的东西。它将随着环境的变化而不断更新,因此您可以将其用作现在和整个职业生涯中使用 Amazon SageMaker 的首选指南。
加入 1,000 多名 Zero To Mastery 毕业生的行列,他们已经被录用,现在在谷歌、特斯拉、亚马逊、苹果、IBM、摩根大通、Facebook、Shopify + 其他顶级科技公司工作。
他们来自不同的背景、年龄和经历。许多人甚至从完全的初学者开始。
所以没有理由不能是你。
而且你没有什么可失去的。因为您现在可以开始学习,如果本课程不是您所期望的,我们将在 100 天内退还您 30%。没有麻烦,也没有问题。
评论(0)