作者简介

Sinan Ozdemir,数据科学家、数学家、约翰·霍普金斯大学讲师,Kylie.ai 公司联合创始人、CTO,在应用数据挖掘、功能分析和算法开发做出基于数据和知识的决策方面拥有丰富的经验。
Divya Susarla,在利用数据方面经验丰富,在包括投资管理、社会企业咨询和红酒营销的各个产业和领域里实现并应用过相应的策略。Kylie.ai 公司产品经理,目前专注于自然语言处理和生成技术。

内容简介

特征工程是数据科学和机器学习流水线上的重要一环,包括识别、清洗、构建和发掘数据的特征,为进一步解释数据并进行预测性分析做准备。

《特征工程入门与实践》囊括了特征工程的全流程,从数据检查到可视化,再到转换和进一步处理等,并给出了大量数学工具,帮助读者掌握如何将数据处理、转换成适当的形式,以便送入计算机和机器学习流水线中进行处理。后半部分的特征工程实践用Python作为示例语言,循序渐进,通俗易懂。

• 识别和利用不同类型的特征

• 清洗数据中的特征,提升预测能力

• 为何、如何进行特征选择和模型误差分析

• 利用领域知识构建新特征

• 基于数学知识交付特征

• 使用机器学习算法构建特征

• 掌握特征工程与特征优化

• 在现实应用中利用特征工程


Sinan Ozdemir,数据科学家、数学家、约翰·霍普金斯大学讲师,Kylie.ai 公司联合创始人、CTO,在应用数据挖掘、功能分析和算法开发做出基于数据和知识的决策方面拥有丰富的经验。

Divya Susarla,在利用数据方面经验丰富,在包括投资管理、社会企业咨询和红酒营销的各个产业和领域里实现并应用过相应的策略。Kylie.ai 公司产品经理,目前专注于自然语言处理和生成技术。

下载地址

豆瓣评论

  • 夏夜星辰
    一天时间读完,文笔酣畅淋漓;主要的收获在概念和思维上;书中推荐的几本书顺便也找到,读一下。04-07
  • Phantom
    没有很多理论,主要是从实践入手。规范化了我的数据处理和机器学习过程,以后写论文处理数据更有底气了。还是要多看一些书,网上的帖子质量参差不齐,还是书更可靠。02-21
  • 普林斯赖
    机器学习入门选择scikit-learn是个很好的选择,简单方便全面,而这本书简直就是scikit-learn主要功能大全,给运用的炉火纯青,理论性不强,实践性非常不错。03-13
  • Lucas
    还不错,sklearn一把梭哈,适合新手05-29
  • summer
    入门不错,7和8可以不看。06-20

猜你喜欢

大家都喜欢