作品简介

全书分为11章。第1章介绍了实时流计算技术的产生背景、使用场景和通用架构。第2章通过实时流计算数据的采集,详细分析了Java高性能编程的理论基础。第3-6章通过从头构造一个分布式实时流计算框架,详细剖析了实时流计算中的几个核心概念和技术重点,并通过多个开源流计算平台的实现来验证这些核心概念和技术重点。第7章谈论了当实在做不到“实时”时,我们应该作出的备选方案。第8-10章阐述了构建一个完整实时流计算系统时,必要的周边辅助系统。第11章给出实时流计算应用案例。

周爽著。

作品目录

  • 前言
  • 第1章 实时流计算
  • 1.1 大数据时代的新挑战:实时流计算
  • 1.2 实时流计算使用场景
  • 1.3 实时流数据的特点
  • 1.4 实时流计算系统架构
  • 1.5 本章小结
  • 第2章 数据采集
  • 2.1 设计数据采集的接口
  • 2.2 使用Sprin Boot实现数据采集服务器
  • 2.3 BIO与NIO
  • 2.4 NIO和异步
  • 2.5 使用Netty实现数据采集服务器
  • 2.6 本章小结
  • 第3章 实现单节点流计算应用
  • 3.1 自己动手写实时流计算框架
  • 3.2 CompletableFuture方法与原理
  • 3.3 采用CompletableFuture实现单节点流处理
  • 3.4 流计算应用的性能调优
  • 3.5 本章小结
  • 第4章 数据处理
  • 4.1 流计算到底在计算什么
  • 4.2 流数据操作
  • 4.3 时间维度聚合特征计算
  • 4.4 关联图谱特征计算
  • 4.5 事件序列分析
  • 4.6 模型学习和预测
  • 4.7 本章小结
  • 第5章 实时流计算的状态管理
  • 5.1 流的状态
  • 5.2 采用Redis实现流信息状态管理
  • 5.3 采用Apache Ignite实现流信息状态管理
  • 5.4 扩展为集群
  • 5.5 本章小结
  • 第6章 开源流计算框架
  • 6.1 Apache Storm
  • 6.2 Spark Streaming
  • 6.3 Apache Samza
  • 6.4 Apache Flink
  • 6.5 本章小结
  • 第7章 当做不到实时
  • 7.1 做不到实时的原因
  • 7.2 Lambda架构
  • 7.3 Kappa架构与架构实例
  • 7.4 本章小结
  • 第8章 数据传输
  • 8.1 消息中间件
  • 8.2 Apache Kafka
  • 8.3 RabbitMQ
  • 8.4 Apache Camel
  • 8.5 本章小结
  • 第9章 数据存储
  • 9.1 存储的设计原则
  • 9.2 点查询
  • 9.3 Ad-Hoc查询
  • 9.4 离线分析
  • 9.5 关系型数据库查询
  • 9.6 本章小结
  • 第10章 服务治理和配置管理
  • 10.1 服务治理
  • 10.2 面向配置编程
  • 10.3 动态配置
  • 10.4 将前端配置与后端服务配置隔离开
  • 10.5 本章小结
  • 第11章 实时流计算应用案例
  • 11.1 实时流数据特征提取引擎
  • 11.2 使用Flink实现风控引擎
  • 11.3 本章小结
展开全部