作品简介

本书详细地介绍了大数据、人工智能等项目中不可或缺的环节和内容:数据准备和特征工程。书中的每节首先以简明方式介绍了基本知识;然后通过实际案例演示了基本知识的实际应用,并提供了针对性练习项目,将“知识、案例、练习”融为一体;最后以“扩展探究”方式引导读者进入更深广的领域。本书既适合作为大学相关专业的教材,也适合作为大数据、人工智能等领域的开发人员的参考读物。

齐伟

自称老齐,现居苏州,所著在线教程《零基础学Python》及《零基础学Python(第2版)》在业内引起非常大的反响。愿意和来自各方的朋友讨论技术问题,并能提供相关技术服务。

作品目录

  • 内容简介
  • 前 言
  • 第1章 感知数据
  • 1.0 了解数据科学项目
  • 1.1 文件中的数据
  • 1.2 数据库中的数据
  • 1.3 网页上的数据
  • 1.4 来自API的数据
  • 第2章 数据清理
  • 2.0 基本概念
  • 2.1 转化数据类型
  • 2.2 处理重复数据
  • 2.3 处理缺失数据
  • 2.4 处理离群数据
  • 第3章 特征变换
  • 3.0 特征的类型
  • 3.1 特征数值化
  • 3.2 特征二值化
  • 3.3 OneHot编码
  • 3.4 数据变换
  • 3.5 特征离散化
  • 3.6 数据规范化
  • 第4章 特征选择
  • 4.0 特征选择简述
  • 4.1 封装器法
  • 4.2 过滤器法
  • 4.3 嵌入法
  • 第5章 特征抽取
  • 5.1 无监督特征抽取
  • 5.2 有监督特征抽取
  • 附录A Jupyter简介
  • 附录B NumPy简介
  • 附录C Pandas简介
  • 附录D Matplotlib简介
  • 后 记
  • 反侵权盗版声明
展开全部