PySpark 秘诀:使用 PySpark2 的问题解决方法
PySpark Recipes: A Problem-Solution Approach with PySpark2
快速找到处理大数据时遇到的常见编程问题的解决方案。内容以流行的问题解决方案格式呈现。查找您要解决的编程问题。阅读解决方案。直接在您自己的代码中应用该解决方案。问题解决了!
PySpark Recipes 介绍了 Hadoop 及其缺点。介绍了 Spark、PySpark 和 RDD 的架构。您将学习应用 RDD 来解决日常大数据问题。Python 和 NumPy 包括在内,使 PySpark 的新学习者可以轻松理解和采用该模型。
您将学到什么 了解
PySpark2 和 SparkSQL 的高级功能
优化您的代码使用 Python 编写
SparkSQL 使用 Python
使用 Spark Streaming 和 Spark MLlib
使用 GraphFrames 执行图形分析
本书适合
数据分析师、Python 程序员、大数据爱好者
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)