作品简介

本书系统地讲解了机器学习的基本知识,以及在实际项目中使用机器学习的基本步骤和方法;详细地介绍了在进行数据处理、分析时怎样选择合适的算法,以及建立模型并优化等方法,通过不同的例子展示了机器学习在具体项目中的应用和实践经验,是一本非常好的机器学习入门和实践的书籍。 不同于很多讲解机器学习的书籍,本书以实践为导向,使用 scikit-learn 作为编程框架,强调简单、快速地建立模型,解决实际项目问题。读者通过对本书的学习,可以迅速上手实践机器学习,并利用机器学习解决实际问题。本书非常适合于项目经理、有意从事机器学习开发的程序员,以及高校相关专业在的读学生阅读。

魏贞原,IBM高级项目经理,主要负责银行客户的复杂系统开发。同时是IBMCIC量子计算COE团队的Python领域专家(Subject Matter Expert),负责量:子计算应用的探索工作,对机器学习和深度学习有深入的研究,精通于运用机器学习来解决数据科学的问题。并运营“知之Python”公众号,定期分享Python在机器学习和深度学习中的实践知识。

作品目录

  • 作者介绍
  • 序言
  • 前言
  • 第一部分 初始
  • 1 初识机器学习
  • 2 Python机器学习的生态圈
  • 3 第一个机器学习项目
  • 4 Python和SciPy速成
  • 第二部分 数据理解
  • 5 数据导入
  • 6 数据理解
  • 7 数据可视化
  • 第三部分 数据准备
  • 8 数据预处理
  • 9 数据特征选定
  • 第四部分 选择模型
  • 10 评估算法
  • 11 算法评估矩阵
  • 12 审查分类算法
  • 13 审查回归算法
  • 14 算法比较
  • 15 自动流程
  • 第五部分 优化模型
  • 16 集成算法
  • 17 算法调参
  • 第六部分 结果部署
  • 18 持久化加载模型
  • 第七部分 项目实践
  • 19 预测模型项目模板
  • 20 回归项目实例
  • 21 二分类实例
  • 22 文本分类实例
  • 附录A
  • A.1 IDE PyCharm介绍
  • A.2 Python文档
  • A.3 SciPy、NumPy、Matplotlib和Pandas文档
  • A.4 树模型可视化
  • A.5 scikit-learn的算法选择路径
  • A.6 聚类分析
展开全部