作品简介

本书以Python3版本作为数据分析与挖掘实战的应用工具,从Pyhton的基础语法开始,陆续介绍有关数值计算的Numpy、数据处理的Pandas、数据可视化的Matplotlib和数据挖掘的Sklearn等内容。全书共涵盖15种可视化图形以及10个常用的数据挖掘算法和实战项目,通过本书的学习,读者可以掌握数据分析与挖掘的理论知识和实战技能。

本书适于统计学、数学、经济学、金融学、管理学以及相关理工科专业的本科生、研究生使用,也能够提高从事数据咨询、研究或分析等人士的专业水平和技能。

刘顺祥,统计学硕士,“数据分析1480”微信公众号运营者。曾就职于大数据咨询公司,为联想、亨氏、美丽田园、网鱼网咖等企业项目提供服务;曾在唯品会大数据部担任数据分析师一职,负责电商支付环节的数据分析业务。

作品目录

  • 作者简介
  • 内容简介
  • 前言
  • 第1章 数据分析与挖掘概述
  • 1.1 什么是数据分析和挖掘
  • 1.2 数据分析与挖掘的应用领域
  • 1.3 数据分析与挖掘的区别
  • 1.4 数据挖掘的流程
  • 1.5 常用的数据分析与挖掘工具
  • 1.6 本章小结
  • 第2章 从收入的预测分析开始
  • 2.1 下载与安装Anoconda
  • 2.2 基于Python的案例实战
  • 2.3 本章小结
  • 第3章 Python快速入门
  • 3.1 数据结构及方法
  • 3.2 控制流
  • 3.3 字符串处理方法
  • 3.4 自定义函数
  • 3.5 一个爬虫案例
  • 3.6 本章小结
  • 第4章 Python数值计算工具——Numpy
  • 4.1 数组的创建与操作
  • 4.2 数组的基本运算符
  • 4.3 常用的数学和统计函数
  • 4.4 线性代数的相关计算
  • 4.5 伪随机数的生成
  • 4.6 本章小结
  • 第5章 Python数据处理工具——Pandas
  • 5.1 序列与数据框的构造
  • 5.2 外部数据的读取
  • 5.3 数据类型转换及描述统计
  • 5.4 字符与日期数据的处理
  • 5.5 常用的数据清洗方法
  • 5.6 数据子集的获取
  • 5.7 透视表功能
  • 5.8 表之间的合并与连接
  • 5.9 分组聚合操作
  • 5.10 本章小结
  • 第6章 Python数据可视化
  • 6.1 离散型变量的可视化
  • 6.2 数值型变量的可视化
  • 6.3 关系型数据的可视化
  • 6.4 多个图形的合并
  • 6.5 本章小结
  • 第7章 线性回归预测模型
  • 7.1 一元线性回归模型
  • 7.2 多元线性回归模型
  • 7.3 回归模型的假设检验
  • 7.4 回归模型的诊断
  • 7.5 本章小结
  • 第8章 岭回归与LASSO回归模型
  • 8.1 岭回归模型
  • 8.2 岭回归模型的应用
  • 8.3 LASSO回归模型
  • 8.4 LASSO回归模型的应用
  • 8.5 本章小结
  • 第9章 Logistic回归分类模型
  • 9.1 Logistic模型的构建
  • 9.2 分类模型的评估方法
  • 9.3 Logistic回归模型的应用
  • 9.4 本章小结
  • 第10章 决策树与随机森林
  • 10.1 节点字段的选择
  • 10.2 决策树的剪枝
  • 10.3 随机森林
  • 10.4 决策树与随机森林的应用
  • 10.5 本章小结
  • 第11章 KNN模型的应用
  • 11.1 KNN算法的思想
  • 11.2 最佳k值的选择
  • 11.3 相似度的度量方法
  • 11.4 近邻样本的搜寻方法
  • 11.5 KNN模型的应用
  • 11.6 本章小结
  • 第12章 朴素贝叶斯模型
  • 12.1 朴素贝叶斯理论基础
  • 12.2 几种贝叶斯模型
  • 12.3 本章小结
  • 第13章 SVM模型的应用
  • 13.1 SVM简介
  • 13.2 几种常见的SVM模型
  • 13.3 分类问题的解决
  • 13.4 预测问题的解决
  • 13.5 本章小结
  • 第14章 GBDT模型的应用
  • 14.1 提升树算法
  • 14.2 梯度提升树算法
  • 14.3 非平衡数据的处理
  • 14.4 XGBoost算法
  • 14.5 本章小结
  • 第15章 Kmeans聚类分析
  • 15.1 Kmeans聚类
  • 15.2 最佳k值的确定
  • 15.3 Kmeans聚类的应用
  • 15.4 Kmeans聚类的注意事项
  • 15.5 本章小结
  • 第16章 DBSCAN与层次聚类分析
  • 16.1 密度聚类简介
  • 16.2 密度聚类与Kmeans的比较
  • 16.3 层次聚类
  • 16.4 密度聚类与层次聚类的应用
  • 16.5 本章小结
展开全部