Cloudera Manager是一个拥有集群自动化安装、中心化管理、集群监控和报警功能的全能型大数据集群管理工具。本套教程基于Cloudera Manager 6.3.1,并使用当下备受企业青睐的CDH 6.3.2,部署于阿里云ECS服务器之上,实现大数据集群的快速自动化安装部署,搭建完成一个功能全面的企业级离线数据仓库。

教程依托真实电商环境,参考众多大厂项目架构,沿用了尚硅谷离线数据仓库5.0项目。搭建的功能模块囊括:用户行为数据采集、业务数据采集、数据仓库分层搭建、全流程自动化调度、报表数据可视化、安全认证、权限管理等。项目功能完善,讲解详细深入。

教程主要内容包括:CDH与Cloudera Manager介绍、阿里云部署CDH各功能模块的流程详解、离线数仓的搭建全流程。

打开网易新闻 查看精彩图片

教程目录

01.CDH_导言
02.CDH_课程介绍
03.CDH_CM_概述
04.CDH_阿里云_购买
05.CDH_阿里云_CM部署前准备
06.CDH_阿里云_脚本
07.CDH_阿里云_部署前_JDK安装
08.CDH_阿里云_部署前_MySQL安装
09.CDH_阿里云_CM安装部署
10.CDH_阿里云_CM集群部署
11.CDH_阿里云_采集模块_HDFS、Yarn、ZK
12.CDH_阿里云_采集模块_HA
13.CDH_阿里云_采集模块_Kafka、Flume
14.CDH_阿里云_数仓环境搭建
15.CDH_阿里云_Flink_Maven安装
16.CDH_阿里云_Flink_CDH版本编译
17.CDH_阿里云_Flink_parcel和CSD
18.CDH_阿里云_Flink_CM安装
19.CDH_阿里云_Kerberos_概念
20.CDH_阿里云_Kerberos_原理
21.CDH_阿里云_Kerberos_安装
22.CDH_阿里云_Kerberos_数据库操作
23.CDH_阿里云_Kerberos_主体认证
24.CDH_阿里云_Kerberos_CM启用
25.CDH_阿里云_Kerberos_实操
26.CDH_阿里云_Sentry_概念
27.CDH_阿里云_Sentry安装部署并与Hive集成
28.CDH_阿里云_Sentry_实战之HUE
29.CDH_阿里云_Sentry_实战之命令行
30.CDH_阿里云_集群规划
31.CDH_阿里云_其他配置
32.CDH_阿里云_离线数仓_日志采集Flume
33.CDH_阿里云_离线数仓_日志消费Flume
34.CDH_阿里云_离线数仓业务数据DataX、Maxwell
35.CDH_阿里云_离线数仓业务数据全表表同步
36.CDH_阿里云_离线数仓业务数据增量表同步
37.CDH_阿里云_离线数仓_ODS-DIM
38.CDH_阿里云_离线数仓_DWD-ADS
39.CDH_阿里云_离线数仓_报表数据导出
40.CDH_阿里云_离线数仓_调度
41.CDH_阿里云_离线数仓_Superset