具有 SQL 专业化的现代大数据分析
Modern Big Data Analysis with SQL Specialization
学习大数据的数据分析。掌握在分布式大数据系统上使用SQL进行数据分析
你将学到什么
区分操作数据库和分析数据库,并了解它们如何应用于大数据
了解数据库和表设计如何提供处理数据的结构
了解数据量和种类的差异如何影响您选择合适的数据库系统
认识旨在与大数据系统一起进行存储和分析的 SQL 方言的特性和优势
您将获得的技能
云存储
数据分析
大数据
Cloudera
SQL
数据库 (DBMS)
数据仓库
Apache Hive
Apache Impala
数据管理
分布式文件系统
关于本专业化
8,326 次近期浏览
本专业化教授使用 SQL 处理大规模数据的基本技能。
也许您是 SQL 的新手并且想学习基础知识。或者您可能已经有一些使用 SQL 来查询关系数据库中较小规模数据的经验。无论哪种方式,如果您有兴趣获得使用现代分布式 SQL 引擎查询大数据所需的技能,本专业化课程都适合您。
大多数教授 SQL 的课程都侧重于传统的关系数据库,但如今,越来越多的生成数据太大而无法存储在那里,而且增长速度太快而无法有效存储在商业数据仓库中。相反,它越来越多地存储在分布式集群和云存储中。这些数据存储具有成本效益且可无限扩展。
要在集群和云存储中查询这些庞大的数据集,您需要一种更新的 SQL 引擎:分布式查询引擎,如 Hive、Impala、Presto 和 Drill。这些是能够查询大量数据集的开源 SQL 引擎。本专业化专注于 Hive 和 Impala,它们是这些查询引擎中部署最广泛的。
此专业化旨在为 Cloudera Certified Associate (CCA) 数据分析师认证考试提供出色的准备。您可以使用本专业化课程教授的相同 SQL 引擎(Hive 和 Impala)参加实践考试,从而获得此认证证书。
应用学习项目
本专业的每门课程都包括一项实践性的、同行评分的作业。要获得专业化证书,您必须成功完成每门课程中的实践、同行评分作业。对于此专业化,没有像其他一些 Coursera 专业化中那样的单独的 Capstone 项目。
评论(0)