作品简介

本书通过实例和项目讲解OpenCV概念及其算法。首先介绍OpenCV的安装和图像处理的基础知识。然后,覆盖用户界面并深入讲解图像处理,读者将学到复杂的计算机视觉算法,并探索机器学习和人脸检测。之后,本书将介绍如何在复杂场景中创建光流视频分析和背景减除,还将讲解文本分割和识别,以及新的和改进的深度学习模块的基础知识。最后,本书介绍了OpenCV的基础知识,例如矩阵运算、滤波器和直方图,帮读者掌握常用的计算机视觉技术,从头开始构建OpenCV项目。

大卫·米兰·埃斯克里瓦(David Millán Escrivá),8岁时用BASIC语言在8086 PC上编写了他的第一个程序。他在瓦伦西亚政治大学(Universitat Politécnica de Valencia)完成了他的IT学习,并在由使用OpenCV(v0.96)的计算机视觉技术所支持的人机交互领域取得了优异的成绩。他拥有人工智能、计算机图形学和模式识别硕士学位,专注于模式识别和计算机视觉。他还拥有超过9年的计算机视觉、计算机图形和模式识别经验。他是Damiles Blog的作者,在上面发表关于OpenCV、计算机视觉和光学字符识别算法的文章与教程。

维尼休斯·G.门东萨(Vinícius G.Mendonça),的计算机图形专业教授。他于1998年开始使用C++进行编程,并于2006年进入计算机游戏和计算机图形领域。他目前是巴西Apple开发者学院(Apple Developer Academy)的导师,从事用于移动设备的金属、机器学习和计算机视觉方面的教学工作。他曾担任其他Packt图书的审校者,包括《OpenNI Cookbook》和《Mastering OpenCV and Computer Vision with OpenCV 3 and Qt5》。在他的研究中,使用了Kinect、OpenNI和OpenCV来识别巴西手语手势。他感兴趣的领域包括移动电话、OpenGL、图像处理、计算机视觉和项目管理。

普拉蒂克·乔希(Prateek Joshi),是一位人工智能研究员、8本书的作者,还是一位TEDx演讲者。他的著作曾入选Forbes 30 Under 30、CNBC、TechCrunch、Silicon Valley Business Journal等多部出版物。他是Pluto AI的创始人,Pluto AI是一家由风投资助的硅谷初创公司,为水利设施建立智能平台。他毕业于南加州大学,获得人工智能专业硕士学位。他之前曾就职于NVIDIA和Microsoft Research。

作品目录

  • 前言
  • 作者简介
  • 审校者简介
  • 第1章 OpenCV入门
  • 1.1 了解人类视觉系统
  • 1.2 人类如何理解图像内容
  • 1.3 你能用OpenCV做什么
  • 1.4 安装OpenCV
  • 1.5 总结
  • 第2章 OpenCV基础知识导论
  • 2.1 技术要求
  • 2.2 基本CMake配置文件
  • 2.3 创建一个库
  • 2.4 管理依赖项
  • 2.5 让脚本更复杂
  • 2.6 图像和矩阵
  • 2.7 读/写图像
  • 2.8 读取视频和摄像头
  • 2.9 其他基本对象类型
  • 2.10 基本矩阵运算
  • 2.11 基本数据存储
  • 2.12 总结
  • 第3章 学习图形用户界面
  • 3.1 技术要求
  • 3.2 OpenCV用户界面介绍
  • 3.3 OpenCV的基本图形用户界面
  • 3.4 Qt图形用户界面
  • 3.5 OpenGL支持
  • 3.6 总结
  • 第4章 深入研究直方图和滤波器
  • 4.1 技术要求
  • 4.2 生成CMake脚本文件
  • 4.3 创建图形用户界面
  • 4.4 绘制直方图
  • 4.5 图像颜色均衡
  • 4.6 Lomography效果
  • 4.7 卡通效果
  • 4.8 总结
  • 第5章 自动光学检查、对象分割和检测
  • 5.1 技术要求
  • 5.2 隔离场景中的对象
  • 5.3 为AOI创建应用程序
  • 5.4 预处理输入图像
  • 5.5 分割输入图像
  • 5.6 总结
  • 第6章 学习对象分类
  • 6.1 技术要求
  • 6.2 机器学习概念介绍
  • 6.3 计算机视觉和机器学习工作流程
  • 6.4 自动对象检查分类示例
  • 6.5 总结
  • 第7章 检测面部部位与覆盖面具
  • 7.1 技术要求
  • 7.2 了解Haar级联
  • 7.3 什么是积分图像
  • 7.4 在实时视频中覆盖面具
  • 7.5 戴上太阳镜
  • 7.6 跟踪鼻子、嘴巴和耳朵
  • 7.7 总结
  • 第8章 视频监控、背景建模和形态学操作
  • 8.1 技术要求
  • 8.2 理解背景减除
  • 8.3 直接的背景减除
  • 8.4 帧差分
  • 8.5 高斯混合方法
  • 8.6 形态学图像处理
  • 8.7 使形状变细
  • 8.8 使形状变粗
  • 8.9 其他形态运算符
  • 8.10 总结
  • 第9章 学习对象跟踪
  • 9.1 技术要求
  • 9.2 跟踪特定颜色的对象
  • 9.3 构建交互式对象跟踪器
  • 9.4 用Harris角点检测器检测点
  • 9.5 用于跟踪的好特征
  • 9.6 基于特征的跟踪
  • 9.7 总结
  • 第10章 开发用于文本识别的分割算法
  • 10.1 技术要求
  • 10.2 光学字符识别介绍
  • 10.3 预处理阶段
  • 10.4 在你的操作系统上安装Tesseract OCR
  • 10.5 使用Tesseract OCR库
  • 10.6 总结
  • 第11章 用Tesseract进行文本识别
  • 11.1 技术要求
  • 11.2 文本API的工作原理
  • 11.3 使用文本API
  • 11.4 总结
  • 第12章 使用OpenCV进行深度学习
  • 12.1 技术要求
  • 12.2 深度学习简介
  • 12.3 OpenCV中的深度学习
  • 12.4 YOLO用于实时对象检测
  • 12.5 用SSD进行人脸检测
  • 12.6 总结
展开全部