作品简介

本书最大的特点在于讲解深度强化学习算法时尽可能地做到化繁为简,书中没有复杂的符号逻辑,也没有大篇幅的公式推导,旨在让读者快速上手,使用深度强化学习方法解决问题。本书不是机械地介绍深度强化学习领域中的知名论文、公式,而是以代码为主导进行讲解,同时辅以详尽的注释、图解及代码运行结果,力求读者在看懂代码的基础上深入理解算法,在理解算法后能够熟练使用。

小川雄太郎(Yutaro Ogawa)编著

作品目录

  • 译者序
  • 前言
  • 第1章 强化学习概述
  • 1.1 机器学习的分类(监督学习、非监督学习、强化学习)
  • 1.2 强化学习、深度强化学习的历史
  • 1.3 深度强化学习的应用实例
  • 参考文献
  • 第2章 在走迷宫任务中实现强化学习
  • 2.1 Try Jupyter的使用方法
  • 2.2 迷宫和智能体的实现
  • 2.3 策略迭代法的实现
  • 2.4 价值迭代法的术语整理
  • 2.5 Sarsa的实现
  • 2.6 实现Q学习
  • 参考文献
  • 第3章 在倒立摆任务中实现强化学习
  • 3.1 在本地PC上准备强化学习的实现和执行环境
  • 3.2 倒立摆任务“CartPole”
  • 3.3 由多变量连续值表示的状态的表格表示
  • 3.4 Q学习的实现
  • 参考文献
  • 第4章 使用PyTorch实现深度学习
  • 4.1 神经网络和深度学习的历史
  • 4.2 深度学习的计算方法
  • 4.3 使用PyTorch实现MNIST手写数字分类任务
  • 参考文献
  • 第5章 深度强化学习DQN的实现
  • 5.1 深度强化学习DQN(深度Q网络)的说明
  • 5.2 实现DQN的四个要点
  • 5.3 实现DQN(上)
  • 5.4 实现DQN(下)
  • 参考文献
  • 第6章 实现深度强化学习的改进版
  • 6.1 深度强化学习算法发展图
  • 6.2 DDQN的实现
  • 6.3 Dueling Network的实现
  • 6.4 优先经验回放的实现
  • 6.5 A2C的实现
  • 参考文献
  • 第7章 在AWS GPU环境中实现消砖块游戏
  • 7.1 消砖块游戏“Breakout”的描述
  • 7.2 准备在AWS上使用GPU所需要的深度学习执行环境
  • 7.3 学习Breakout的四个关键思想
  • 7.4 A2C的实现(上)
  • 7.5 A2C的实现(下)
  • 参考文献
  • 后记
展开全部