开始 Apache Spark 3
Beginning Apache Spark 3
使用 DataFrame、Spark SQL、结构化流和 Spark 机器学习库
踏上发现、学习和使用 Apache Spark 3.0 的旅程。在本书中,您将获得有关 Apache Spark 内部强大而高效的分布式数据处理引擎的专业知识;用于批量和流式处理数据的用户友好、全面和灵活的编程模型;以及用于构建机器学习应用程序的可扩展机器学习算法和实用工具。
开始 Apache Spark 3 首先解释与 Apache Spark 交互的不同方式,例如 Spark 概念和架构,以及 Spark 统一堆栈。接下来,它提供了 Spark SQL 的概述,然后再介绍其高级功能。它涵盖了处理性能问题的技巧和技术,然后是结构化流处理引擎的概述。它最后演示了如何使用 Spark MLlib 开发机器学习应用程序以及如何管理机器学习开发生命周期。本书包含大量实用示例和代码片段,可帮助您在了解每个部分后立即掌握概念和功能。
阅读本书后,您将具备构建自己的大数据管道、应用程序和机器学习应用程序所需的知识。
你会:
掌握 Spark 统一数据分析引擎及其各种组件
协同工作以提供可扩展、容错和高性能的数据处理引擎
利用用户友好且灵活的编程模型,使用 DataFrame 和 Spark SQL 执行从简单到复杂的数据分析
开发机器学习使用 Spark MLlib 的应用程序 使用
MLflow 管理机器学习开发生命周期
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。


评论(0)