作品简介

全书共13章,分为2篇。第1篇基础知识,介绍了人工智能发展里程、计算机视觉概要、深度学习和计算机视觉中的基础数学知识、神经网络及其相关的机器学习基础、卷积神经网络及其一些常见结构,最后对最前沿的趋势进行了简单探讨。第2篇实例精讲,介绍了Python基础、OpneCV基础、最简单的分类神经网络、图像识别、利用Caffe做回归、迁移学习和模型微调、目标检测、度量学习和图像风格迁移等常见的计算机视觉应用场景。从第5章开始包含了很多有趣和实用的代码示例。从第7章开始的所有实例都基于当前最流行的深度学习框架中的Caffe和MXNet,其中包含了作者原创的大量代码和搜集的数据,这些代码和作者训练好的部分模型已分享到本书github页面上供读者自行下载。

代码库地址:

https://github.com/frombeijingwithlove/dlcv_for_beginners

叶韵博士,现在京东从事深度学习和计算机视觉算法研发。加入京东之前,曾在ProPlus Design Solutions硅谷和北京研发中心任职研发经理,负责统计建模算法研发,后加入SiemensCorporate Technology担任Research Scientist,专注计算影像和计算机视觉的研究。叶博士于2007年7月获得北京大学微电子学士学位,2011年4月获得Arizona State University的Electrical Engineering博士学位。

作品目录

  • 序言
  • 前言
  • 第1篇 基础知识
  • 第1章 引言
  • 1.1 人工智能的新焦点——深度学习
  • 1.2 给计算机一双眼睛——计算机视觉
  • 1.3 基于深度学习的计算机视觉
  • 第2章 深度学习和计算机视觉中的基础数学知识
  • 2.1 线性变换和非线性变换
  • 2.2 概率论及相关基础知识
  • 2.3 维度的诅咒
  • 2.4 卷积
  • 2.5 数学优化基础
  • 第3章 神经网络和机器学习基础
  • 3.1 感知机
  • 3.2 神经网络基础
  • 3.3 后向传播算法
  • 3.4 随机梯度下降和批量梯度下降
  • 3.5 数据、训练策略和规范化
  • 3.6 监督学习、非监督学习、半监督学习和强化学习
  • 第4章 深度卷积神经网络
  • 4.1 卷积神经网络
  • 4.2 LeNet——第一个卷积神经网络
  • 4.3 新起点——AlexNet
  • 4.4 更深的网络——GoogLeNet
  • 4.5 更深的网络——ResNet
  • 第2篇 实例精讲
  • 第5章 Python基础
  • 5.1 Python简介
  • 5.2 Python基本语法
  • 5.3 Python的科学计算包——NumPy
  • 5.4 Python的可视化包——matplotlib
  • 第6章 OpenCV基础
  • 6.1 OpenCV简介
  • 6.2 Python-OpenCV基础
  • 6.3 用OpenCV实现数据增加小工具
  • 6.4 用OpenCV实现物体标注小工具
  • 第7章 Hello World!
  • 7.1 用MXNet实现一个神经网络
  • 7.2 用Caffe实现一个神经网络
  • 第8章 最简单的图片分类——手写数字识别
  • 8.1 准备数据——MNIST
  • 8.2 基于Caffe的实现
  • 8.3 基于MXNet的实现
  • 第9章 利用Caffe做回归
  • 9.1 回归的原理
  • 9.2 预测随机噪声的频率
  • 第10章 迁移学习和模型微调
  • 10.1 吃货必备——通过Python采集美食图片
  • 10.2 美食分类模型
  • 第11章 目标检测
  • 11.1 目标检测算法简介
  • 11.2 基于PASCAL VOC数据集训练SSD模型
  • 第12章 度量学习
  • 12.1 距离和度量学习
  • 12.2 用MNIST训练Siamese网络
  • 第13章 图像风格迁移
  • 13.1 风格迁移算法简介
  • 13.2 MXNet中的图像风格迁移例子
展开全部