作品简介

本书从企业的实际需求出发,完整地介绍了构建一个真实可用、安全可靠的企业级大数据平台所需要运用的知识体系,并详细地描述了构建企业级大数据平台的设计方案和实施步骤。本书逻辑上可分为3大部分,共8章,每个章节循序渐进:第一部分(第1、2章)描述了企业级大数据平台的需求和能力。第二部分(第3~5章)着重讲述了如何去搭建并配置一个大数据平台,以及如何构建非常重要的平台安全方案。第三部分(第6~8章)以实战的形式讲解如何以Java编码的方式实现平台的基础管理功能,以提升其易用性与可用性。

朱凯著。

作品目录

  • 推荐序 思者常新,厚积薄发
  • 前言
  • 第1章 浅谈企业级大数据平台的重要性
  • 1.1 缺乏统一大数据平台的问题
  • 1.2 构建统一大数据平台的优势
  • 1.3 企业级大数据平台需要具备的基本能力
  • 1.4 平台辅助工具
  • 1.5 本章小结
  • 第2章 企业级大数据平台技术栈介绍
  • 2.1 HDFS
  • 2.2 Zookeeper
  • 2.3 HBase
  • 2.4 YARN
  • 2.5 Spark
  • 2.6 本章小结
  • 第3章 使用Ambari安装Hadoop集群
  • 3.1 概述
  • 3.2 集群设计
  • 3.3 Ambari的安装、配置与启动
  • 3.4 新建集群
  • 3.5 Ambari控制台功能简介
  • 3.6 本章小结
  • 第4章 构建企业级平台安全方案
  • 4.1 浅谈企业级大数据平台面临的安全隐患
  • 4.2 初级安全方案
  • 4.3 本章小结
  • 第5章 Hadoop服务安全方案
  • 5.1 Kerberos协议简介
  • 5.2 使用FreeIPA安装Kerberos和LDAP
  • 5.3 开启Ambari的Kerberos安全选项
  • 5.4 本章小结
  • 第6章 单点登录与用户管理
  • 6.1 集成单点登录
  • 6.2 实现统一的用户管理系统
  • 6.3 使用Java程序调用脚本
  • 6.4 创建Ranger扩展用户
  • 6.5 本章小结
  • 第7章 搭建平台管理端RESTful服务
  • 7.1 搭建RESTful服务框架
  • 7.2 用户查询
  • 7.3 RESTful服务安全认证
  • 7.4 数据仓库数据查询
  • 7.5 数据仓库元数据查询
  • 7.6 本章小结
  • 第8章 Spark任务与调度服务
  • 8.1 提交Spark任务的3种方式
  • 8.2 查询Spark日志
  • 8.3 任务调度
  • 8.4 本章小结
  • 附录A Hadoop简史
  • 附录B Hadoop生态其他常用组件一览
  • 附录C 常用组件配置说明
展开全部