作品简介

这是一本深入浅出且极富趣味的深度学习入门书。本书选取深度学习近年来最重大的突破之一AlphaGo,将其背后的技术和原理娓娓道来,并配合一套基于BetaGo的开源代码,带领读者从零开始一步步实现自己的“AlphaGo”。本书侧重实践,深入浅出,庖丁解牛般地将深度学习和AlphaGo这样深奥的话题变得平易近人、触手可及,内容非常精彩。全书共分为3个部分:第一部分介绍机器学习和围棋的基础知识,并构建一个最简围棋机器人,作为后面章节内容的基础;第二部分分层次深入介绍AlphaGo背后的机器学习和深度学习技术,包括树搜索、神经网络、深度学习机器人和强化学习,以及强化学习的几个高级技巧,包括策略梯度、价值评估方法、演员-评价方法3类技术;第三部分将前面两部分准备好的知识集成到一起,并最终引导读者实现自己的AlphaGo,以及改进版AlphaGo Zero。读完本书之后,读者会对深度学习这个学科以及AlphaGo的技术细节有非常全面的了解,为进一步深入钻研AI理论、拓展AI应用打下良好基础。本书不要求读者对AI或围棋有任何了解,只需要了解基本的Python语法以及基础的线性代数和微积分知识。

马克斯·帕佩拉(Max Pumperla)就职于Skymind公司,是一名专职研究深度学习的数据科学家和工程师。他是深度学习平台Aetros的联合创始人。

凯文·费格森(Kevin Ferguson)在分布式系统和数据科学领域拥有18年的工作经验。他是Honor公司的数据科学家,曾就职于谷歌和Meebo等公司。

Max和Kevin是BetaGo的共同创造者。BetaGo是用Python开发的极少数开源围棋机器人之一。

作品目录

  • 内容提要
  • 战罢两奁分白黑,一枰何处有亏成(译者序)
  • 前言
  • 资源与支持
  • 致谢
  • 关于本书
  • 关于作者
  • 第一部分 基础知识
  • 第1章 走近深度学习:机器学习入门
  • 第2章 围棋与机器学习
  • 第3章 实现第一个围棋机器人
  • 第二部分 机器学习和游戏AI
  • 第4章 使用树搜索下棋
  • 第5章 神经网络入门
  • 第6章 为围棋数据设计神经网络
  • 第7章 从数据中学习:构建深度学习机器人
  • 第8章 实地部署围棋机器人
  • 第9章 通过实践学习:强化学习
  • 第10章 基于策略梯度的强化学习
  • 第11章 基于价值评估方法的强化学习
  • 第12章 基于演员-评价方法的强化学习
  • 第三部分 一加一大于二
  • 第13章 AlphaGo:全部集结
  • 第14章 AlphaGo Zero:将强化学习集成到树搜索中
  • 附录A 数学基础
  • 附录B 反向传播算法
  • 附录C 围棋程序与围棋服务器
  • 附录D 用AWS来训练和部署围棋程序与围棋服务器
  • 附录E 将机器人发布到OGS
展开全部