作品简介

本书详细讲解了Python数据分析的相关内容,共分为10章,第1~9章分别讲解了数据分析概述、Python与数据分析、Python语言基础、NumPy数组与矢量计算、用NumPy进行简单统计分析、数据可视化——Matplotlib库、pandas数据分析基础、用pandas进行数据预处理、机器学习库scikit-learn入门;第10章用一个综合案例——电影数据分析项目,带领读者灵活掌握本书所学内容。

本书适合作为高等院校本、专科计算机相关专业的教材,也可供爱好者自学使用。

郑丹青,女,高级工程师,教授。在企业从事计算机软件开发二十多年,获株洲市科委奖励。从事职业教育15年,是湖南省计算机应用技术省级专业带头人,获得2016年湖南省“移动互联应用技术”省级培训优秀学员。

作品目录

  • 内容提要
  • 前言
  • 第1章 数据分析概述
  • 1.1 数据的性质
  • 1.2 数据分析
  • 本章小结
  • 思考练习
  • 第2章 Python与数据分析
  • 2.1 Python简介
  • 2.2 Python与数据分析的关系
  • 2.3 Python数据分析常用的类库
  • 2.4 Python开发环境的搭建
  • 2.5 Python集成开发环境的搭建
  • 项目实践
  • 本章小结
  • 思考练习
  • 第3章 Python语言基础
  • 3.1 Python基础语法
  • 3.2 Python的数据类型
  • 3.3 Python流程控制语句
  • 3.4 Python的函数
  • 项目实践
  • 本章小结
  • 思考练习
  • 第4章 NumPy数组与矢量计算
  • 4.1 NumPy概述
  • 4.2 NumPy数组对象
  • 4.3 NumPy数组操作
  • 4.4 NumPy数组的矢量计算
  • 4.5 NumPy矩阵创建、计算及操作
  • 4.6 随机数的生成
  • 项目实践
  • 本章小结
  • 思考练习
  • 第5章 用NumPy进行简单统计分析
  • 5.1 文件读写操作
  • 5.2 NumPy常用的统计函数
  • 5.3 使用NumPy函数进行统计分析
  • 5.4 简单的统计分析
  • 项目实践
  • 本章小结
  • 思考练习
  • 第6章 数据可视化——Matplotlib库
  • 6.1 Matplotlib概述
  • 6.2 使用pyplot创建图形
  • 6.3 Matplotlib参数配置
  • 6.4 分析变量间关系图
  • 6.5 分析变量数据分布和分散状况
  • 项目实践
  • 本章小结
  • 思考练习
  • 第7章 pandas数据分析基础
  • 7.1 pandas概述
  • 7.2 pandas的数据结构及常用操作
  • 7.3 pandas的索引
  • 7.4 pandas数据结构之间的运算
  • 7.5 pandas的函数应用
  • 7.6 数据读取与写入
  • 7.7 数据分析方法
  • 项目实践
  • 本章小结
  • 思考练习
  • 第8章 用pandas进行数据预处理
  • 8.1 数据清洗
  • 8.2 数据合并
  • 8.3 数据抽取
  • 8.4 重塑层次化索引
  • 8.5 映射与数据转换
  • 8.6 排列与随机抽样
  • 8.7 日期转换、日期格式化和日期抽取
  • 8.8 字符串处理
  • 项目实践
  • 本章小结
  • 思考练习
  • 第9章 机器学习库scikit-learn入门
  • 9.1 机器学习概述
  • 9.2 scikit-learn概述
  • 9.3 第一个机器学习程序
  • 9.4 使用scikit-learn进行机器学习
  • 项目实践
  • 本章小结
  • 思考练习
  • 第10章 电影数据分析项目
  • 10.1 项目描述
  • 10.2 准备数据
  • 10.3 数据清洗
  • 10.4 数据分析与数据可视化
  • 本章小结
  • 思考练习
  • 参考文献
展开全部