作品简介

大数据发展至今,早已不是一个新兴词语,大数据的应用已经无处不在。在大数据时代,我们面临的不仅是海量的数据,更重要的是海量数据所带来的数据的采集、存储、处理等方方面面的问题。为了更快速、更全面地展示大数据的实践应用,本书以一个数据仓库项目为切入点,带领读者一步步揭开大数据的面纱。

尚硅谷IT教育

一直坚持“技术为王”的发展理念,我们专注技术,不断钻研课程,团队中技术型人才占比60%以上,设有独立的研究院,与多家互联网大型企业的研发团队保持技术交流,保障教学内容始终基于研发一线。

作品目录

  • 内容简介
  • 前言
  • 关于我们
  • 第1章 大数据与数据仓库概论
  • 1.1 大数据概论
  • 1.2 数据仓库概论
  • 1.3 学前导读
  • 1.4 本章总结
  • 第2章 项目需求描述
  • 2.1 任务概述
  • 2.2 业务描述
  • 2.3 系统运行环境
  • 2.4 本章总结
  • 第3章 项目部署的环境准备
  • 3.1 Linux环境准备
  • 3.2 Linux环境配置
  • 3.3 Hadoop环境搭建
  • 3.4 本章总结
  • 第4章 用户行为数据采集模块
  • 4.1 日志生成
  • 4.2 采集日志的Flume
  • 4.3 消息队列Kafka
  • 4.4 消费Kafka日志的Flume
  • 4.5 采集通道启动、停止脚本
  • 4.6 本章总结
  • 第5章 业务数据采集模块
  • 5.1 电商业务概述
  • 5.2 业务数据采集
  • 5.3 本章总结
  • 第6章 数据仓库搭建模块
  • 6.1 数据仓库理论准备
  • 6.2 数据仓库搭建环境准备
  • 6.3 数据仓库搭建——ODS层
  • 6.4 数据仓库搭建——DWD层
  • 6.5 数据仓库搭建——DWS层
  • 6.6 数据仓库搭建——DWT层
  • 6.7 数据仓库搭建——ADS层
  • 6.8 结果数据导出脚本
  • 6.9 会员主题指标获取的全调度流程
  • 6.10 本章总结
  • 第7章 数据可视化模块
  • 7.1 模拟可视化数据
  • 7.2 Superset部署
  • 7.3 Superset使用
  • 7.4 本章总结
  • 第8章 即席查询模块
  • 8.1 Presto
  • 8.2 Druid
  • 8.3 Kylin
  • 8.4 即席查询框架对比
  • 8.5 本章总结
  • 第9章 元数据管理模块
  • 9.1 Atlas入门
  • 9.2 Atlas安装及使用
  • 9.3 Atlas界面查看及使用
  • 9.4 本章总结
展开全部