作品简介

本书系统介绍了大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。全书共15章,内容包含大数据的基本概念、大数据处理架构Hadoop,分布式文件系统HDFS,分布式数据库HBase,NoSQL数据库、云数据库、MapReduce,Spark流计算、图计算、数据可视化以及大数据在互联网、生物医学领域和其他行业的应用。本书在Hadoop,HDFS,HBase,MapReduce和Spark等重要章节安排了入门级的实践操作,以便读者更好地学习和掌握大数据关键技术。

本书可以作为高等院校计算机、信息管理等相关专业的大数据课程教材,也可供相关技术人员参考。

林子雨,北大博士,厦门大学计算机科学系老师,中国高校首个"数字教师"的提出者和建设者。在数据库、数据仓库、数据挖掘、大数据、云计算和物联网等领域有着十多年的知识积累,对各个领域知识都有比较深入的了解,有比较宽泛的视野。

作品目录

  • 内容提要
  • 前言(第2版)
  • 前言(第1版)
  • 作者介绍
  • 第一篇 大数据基础
  • 第1章 大数据概述
  • 1.1 大数据时代
  • 1.2 大数据的概念
  • 1.3 大数据的影响
  • 1.4 大数据的应用
  • 1.5 大数据关键技术
  • 1.6 大数据计算模式
  • 1.7 大数据产业
  • 1.8 大数据与云计算、物联网
  • 1.9 本章小结
  • 1.10 习题
  • 第2章 大数据处理架构Hadoop
  • 2.1 概述
  • 2.2 Hadoop生态系统
  • 2.3 Hadoop的安装与使用
  • 2.4 本章小结
  • 2.5 习题
  • 实验1 安装Hadoop
  • 第二篇 大数据存储与管理
  • 第3章 分布式文件系统HDFS
  • 3.1 分布式文件系统
  • 3.2 HDFS简介
  • 3.3 HDFS的相关概念
  • 3.4 HDFS体系结构
  • 3.5 HDFS的存储原理
  • 3.6 HDFS的数据读写过程
  • 3.7 HDFS编程实践
  • 3.8 本章小结
  • 3.9 习题
  • 实验2 熟悉常用的HDFS操作
  • 第4章 分布式数据库HBase
  • 4.1 概述
  • 4.2 HBase访问接口
  • 4.3 HBase数据模型
  • 4.4 HBase的实现原理
  • 4.5 HBase运行机制
  • 4.6 HBase编程实践
  • 4.7 本章小结
  • 4.8 习题
  • 实验3 熟悉常用的HBase操作
  • 第5章 NoSQL数据库
  • 5.1 NoSQL简介
  • 5.2 NoSQL兴起的原因
  • 5.3 NoSQL与关系数据库的比较
  • 5.4 NoSQL的四大类型
  • 5.5 NoSQL的三大基石
  • 5.6 从NoSQL到NewSQL数据库
  • 5.7 本章小结
  • 5.8 习题
  • 第6章 云数据库
  • 6.1 云数据库概述
  • 6.2 云数据库产品
  • 6.3 云数据库系统架构
  • 6.4 云数据库实践
  • 6.5 本章小结
  • 6.6 习题
  • 实验4 熟练使用RDS for MySQL数据库
  • 第三篇 大数据处理与分析
  • 第7章 MapReduce
  • 7.1 概述
  • 7.2 MapReduce的工作流程
  • 7.3 实例分析:WordCount
  • 7.4 MapReduce的具体应用
  • 7.5 MapReduce编程实践
  • 7.6 本章小结
  • 7.7 习题
  • 实验5 MapReduce编程初级实践
  • 第8章 Hadoop再探讨
  • 8.1 Hadoop的优化与发展
  • 8.2 HDFS2.0的新特性
  • 8.3 新一代资源管理调度框架YARN
  • 8.4 Hadoop生态系统中具有代表性的功能组件
  • 8.5 本章小结
  • 8.6 习题
  • 第9章 Spark
  • 9.1 概述
  • 9.2 Spark生态系统
  • 9.3 Spark运行架构
  • 9.4 Spark的部署和应用方式
  • 9.5 Spark编程实践
  • 9.6 本章小结
  • 9.7 习题
  • 第10章 流计算
  • 10.1 流计算概述
  • 10.2 流计算的处理流程
  • 10.3 流计算的应用
  • 10.4 开源流计算框架Storm
  • 10.5 Spark Streaming
  • 10.6 本章小结
  • 10.7 习题
  • 第11章 图计算
  • 11.1 图计算简介
  • 11.2 Pregel简介
  • 11.3 Pregel图计算模型
  • 11.4 Pregel的C++ API
  • 11.5 Pregel的体系结构
  • 11.6 Pregel的应用实例
  • 11.7 Pregel和MapReduce实现PageRank算法的对比
  • 11.8 本章小结
  • 11.9 习题
  • 第12章 数据可视化
  • 12.1 可视化概述
  • 12.2 可视化工具
  • 12.3 可视化典型案例
  • 12.4 本章小结
  • 12.5 习题
  • 第四篇 大数据应用
  • 第13章 大数据在互联网领域的应用
  • 13.1 推荐系统概述
  • 13.2 协同过滤
  • 13.3 协同过滤实践
  • 13.4 本章小结
  • 13.5 习题
  • 第14章 大数据在生物医学领域的应用
  • 14.1 流行病预测
  • 14.2 智慧医疗
  • 14.3 生物信息学
  • 14.4 案例:基于大数据的综合健康服务平台
  • 14.5 本章小结
  • 14.6 习题
  • 第15章 大数据的其他应用
  • 15.1 大数据在物流领域中的应用
  • 15.2 大数据在城市管理中的应用
  • 15.3 大数据在金融行业中的应用
  • 15.4 大数据在汽车行业中的应用
  • 15.5 大数据在零售行业中的应用
  • 15.6 大数据在餐饮行业中的应用
  • 15.7 大数据在电信行业中的应用
  • 15.8 大数据在能源行业中的应用
  • 15.9 大数据在体育和娱乐领域中的应用
  • 15.10 大数据在安全领域中的应用
  • 15.11 大数据在政府领域中的应用
  • 15.12 大数据在日常生活中的应用
  • 15.13 本章小结
  • 15.14 习题
  • 参考文献
展开全部