作品简介

本书首先利用Pandas对美股秒级交易数据进行分析,利用Scikit-learn对股票变化方向进行预测,并在架构案例中,打造了一个以RabbitMQ为消息传导中枢的实时处理系统,利用Elasticsearch对数据进行实时可视化。

彭河森,资深机器学习科学家,曾在Google、Amazon、微软等公司从事一线机器学习架构和开发工作,参与了Google实时数据警报、Amazon产品广告自动化优化,微软必应广告等多项海量数据、延时要求苛刻的机器学习应用工作。

汪涵,资深机器学习开发者,曾是Amazon、微软、Quantlab、晨星等公司一线机器学习开发人员,参与了Amazon AB检验服务、微软必应搜索问答系统等多项关键大数据处理和机器学习应用的架构和开发工作。对机器学习、自然语言处理有着深刻的体会。

作品目录

  • 前言
  • 第1部分 实时机器学习方法论
  • 第1章 实时机器学习综述
  • 1.1 什么是机器学习
  • 1.2 机器学习发展的前世今生
  • 1.3 机器学习领域分类
  • 1.4 实时是个“万灵丹”
  • 1.5 实时机器学习的分类
  • 1.6 实时应用对机器学习的要求
  • 1.7 案例:Netflix在机器学习竞赛中学到的经验
  • 1.8 实时机器学习模型的生存期
  • 第2章 实时监督式机器学习
  • 2.1 什么是监督式机器学习
  • 2.2 怎样衡量监督式机器学习模型
  • 2.3 实时线性分类器介绍
  • 第3章 数据分析工具Pandas
  • 3.1 颠覆R的Pandas
  • 3.2 Pandas的安装
  • 3.3 利用Pandas分析实时股票报价数据
  • 3.4 数据分析的三个要点
  • 第4章 机器学习工具Scikit-learn
  • 4.1 如何站在风口上?向Scikit-learn学习
  • 4.2 Scikit-learn的安装
  • 4.3 Scikit-learn的主要模块
  • 4.4 利用Scikit-learn进行股票价格波动预测
  • 第2部分 实时机器学习架构
  • 第5章 实时机器学习架构设计
  • 5.1 设计实时机器学习架构的四个要点
  • 5.2 Lambda架构和主要成员
  • 5.3 常用的实时机器学习架构
  • 5.4 小结
  • 第6章 集群部署工具Docker
  • 6.1 Docker的前世今生
  • 6.2 容器虚拟机的基本组成部分
  • 6.3 Docker引擎命令行工具
  • 6.4 通过Dockerfile配置容器虚拟机
  • 6.5 服务器集群配置工具Docker Compose
  • 6.6 远端服务器配置工具Docker Machine
  • 6.7 其他有潜力的Docker工具
  • 第7章 实时消息队列和RabbitMQ
  • 7.1 实时消息队列
  • 7.2 AMQP和RabbitMQ简介
  • 7.3 RabbitMQ的主要构成部分
  • 7.4 常用交换中心模式
  • 7.5 消息传导设计模式
  • 7.6 利用Docker快速部署RabbitMQ
  • 7.7 利用RabbitMQ开发队列服务
  • 第8章 实战数据库综述
  • 8.1 SQL与NoSQL,主流数据库分类
  • 8.2 数据库的性能
  • 8.3 SQL和NoSQL对比
  • 8.4 数据库的发展趋势
  • 8.5 MySQL简介
  • 8.6 Cassandra简介
  • 第9章 实时数据监控ELK集群
  • 9.1 Elasticsearch、LogStash和Kibana的前世今生
  • 9.2 Elasticsearch基本架构
  • 9.3 Elasticsearch快速入门
  • 9.4 Kibana快速入门
  • 第10章 机器学习系统设计模式
  • 10.1 设计模式的前世今生
  • 10.2 读:高速键值模式
  • 10.3 读:缓存高速查询模式
  • 10.4 更新:异步数据库更新模式
  • 10.5 更新:请求重定向模式
  • 10.6 处理:硬实时并行模式
  • 10.7 处理:分布式任务队列模式
  • 10.8 处理:批实时处理模式
  • 第3部分 未来展望
  • 第11章 Serverless架构
  • 11.1 Serverless架构的前世今生
  • 11.2 Serverless架构对实时机器学习的影响
  • 第12章 深度学习的风口
  • 12.1 深度学习的前世今生
  • 12.2 深度学习的难点
  • 12.3 如何选择深度学习工具
  • 12.4 未来发展方向
展开全部