作品简介

本书共14章,分三个部分:基础篇、实战篇、高级篇。基础篇介绍了数据挖掘、Hadoop大数据的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得大数据项目挖掘分析经验,同时快速领悟看似难懂的大数据分析与挖掘理论知识。

读者在阅读过程中,应充分利用随书配套的案例建模数据,借助TipDM-HB大数据挖掘建模平台,通过上机实验,以快速理解相关知识与理论。

作品目录

  • 前言
  • 第一篇 基础篇
  • 第1章 浅谈大数据
  • 1.1 大数据概述
  • 1.2 大数据平台
  • 1.3 本章小结
  • 第2章 大数据存储与运算利器—Hadoop
  • 2.1 Hadoop概述
  • 2.2 Hadoop配置及IDE配置
  • 2.3 Hadoop集群命令
  • 2.4 Hadoop编程开发
  • 2.5 K-Means算法原理及Hadoop MapReduce实现
  • 2.6 TF-IDF算法原理及Hadoop MapReduce实现
  • 2.7 本章小结
  • 第3章 大数据查询—Hive
  • 3.1 Hive概述
  • 3.2 HiveQL语句
  • 3.3 动手实践:基于Hive的学生信息查询
  • 3.4 基于Hive的航空公司客户价值数据预处理及分析
  • 3.5 本章小结
  • 第4章 大数据快速读写—HBase
  • 4.1 HBase概述
  • 4.2 配置HBase集群
  • 4.3 HBase原理与架构组件
  • 4.4 HBase Shell操作
  • 4.5 Java API&MapReduce与HBase交互
  • 4.6 基于HBase的冠字号查询系统
  • 4.7 本章小结
  • 第5章 大数据处理—Pig
  • 5.1 Pig概述
  • 5.2 配置运行Pig
  • 5.3 常用Pig Latin操作
  • 5.4 综合实践
  • 5.5 本章小结
  • 第6章 大数据快速运算与挖掘—Spark
  • 6.1 Spark概述
  • 6.2 Spark安装集群
  • 6.3 Spark架构与核心原理
  • 6.4 Spark编程技巧
  • 6.5 如何学习Spark MLlib
  • 6.6 动手实践:基于Spark ALS电影推荐系统
  • 6.7 本章小结
  • 第7章 大数据工作流—Oozie
  • 7.1 Oozie简介
  • 7.2 编译配置并运行Oozie
  • 7.3 Oozie WorkFlow实践
  • 7.4 Oozie Coordinator实践
  • 7.5 本章小结
  • 第二篇 挖掘实战篇
  • 第8章 法律服务大数据智能推荐
  • 8.1 背景
  • 8.2 目标
  • 8.3 系统架构及流程
  • 8.4 分析过程及实现
  • 8.5 构建法律服务大数据智能推荐系统
  • 8.6 本章小结
展开全部