作品简介

本书创造性地汇编了数据挖掘技术,将统计数据挖掘和机器学习数据挖掘进行了区分,对经典和现代统计方法框架进行了扩展,以用于预测建模和大数据分析。本书在第2版的基础上新增了13章,内容涵盖数据科学发展历程、市场份额估算、无抽样调研数据预测钱包份额、潜在市场细分、利用缺失数据构建统计回归模型、十分位分析评估数据的预测能力,以及一个无须精通自然语言处理就能使用的文本挖掘工具。本书适合数据挖掘从业者以及对机器学习数据挖掘感兴趣的人阅读。

布鲁斯·拉特纳(Bruce Ratner),统计分析师,是DM-1-1咨询公司的总裁和创始人,该公司致力于统计建模、分析和数据挖掘的样本,以及在DM领域的机器学习数据挖掘。DM stat1专门研究所有标准的统计技术,以及利用机器学习/统计算法,如其专利的GenIQ模型,实现其客户目标的方法,包括直接和数据库营销、银行、保险、金融、零售、电信、医疗、医药、出版和流通、大众与直接广告、目录营销、电子商务、网络挖掘、B2B、人力资本管理、风险管理、非营利筹款等。Bruce拥有数学和统计学的博士学位,专注于多元统计和反应模型模拟。他的研究兴趣包括开发混合建模技术,将传统的统计数据和机器学习方法结合起来。他拥有一项独特的专利申请,用于解决遗传规划中的两组分类问题。

作品目录

  • 第3版前言
  • 第2版前言
  • 致谢
  • 关于作者
  • 第1章 引论
  • 第2章 数据处理相关学科:统计学和数据科学
  • 第3章 变量评估的两种基本数据挖掘方法
  • 第4章 用于评估成对变量的基于CHAID的数据挖掘方法
  • 第5章 校直数据的简单性和可取性对建模十分重要
  • 第6章 排序数据对称化:提高数据预测能力的统计数据挖掘方法
  • 第7章 主成分分析:多变量评估的统计数据挖掘方法
  • 第8章 市场份额估算:一个特殊的数据挖掘案例
  • 第9章 相关系数在[-1,+1]内取值,是这样吗
  • 第10章 逻辑斯谛回归:回应建模方法
  • 第11章 无抽样调研数据预测钱包份额
  • 第12章 普通回归:利润建模的强大工具
  • 第13章 回归变量选择方法:可忽略的问题和重要解决方案
  • 第14章 用CHAID解读逻辑斯谛回归模型
  • 第15章 回归系数的重要性
  • 第16章 相关系数均值:评估预测模型和预测变量重要性的统计数据挖掘指标
  • 第17章 交互变量指定CHAID模型
  • 第18章 市场细分:逻辑斯谛回归建模
  • 第19章 市场细分:时间序列数据LCA
  • 第20章 市场细分:理解细分群体的便捷途径
  • 第21章 统计回归模型:理解模型的简单方法
  • 第22章 CHAID:填充缺失值的方法
  • 第23章 大数据建模
  • 第24章 艺术、科学、数字和诗歌
  • 第25章 识别最佳客户:描述性、预测性和相似性描述
  • 第26章 营销模型评估
  • 第27章 十分位分析:视角与效果
  • 第28章 T-C净提升度模型:评估试验组与对照组的营销效果
  • 第29章 自助法在营销中的应用:一种新的模型验证方法
  • 第30章 用自助法验证逻辑斯谛回归模型
  • 第31章 营销模型可视化:用数据深度挖掘模型
  • 第32章 预测贡献系数:预测重要性的度量
  • 第33章 建模是艺术、科学与诗的结合
  • 第34章 献给数据狂的数据分析12步法
  • 第35章 遗传回归模型与统计回归模型
  • 第36章 数据重用:GenIQ模型的强大数据挖掘技术
  • 第37章 数据挖掘技术——离群值的调整
  • 第38章 过拟合的全新解决方案
  • 第39章 回顾:为何校直数据如此重要
  • 第40章 GenIQ模型的定义与应用
  • 第41章 如何为营销模型选择最佳变量
  • 第42章 解读无系数模型
  • 第43章 文本挖掘:入门、示例及TXTDM软件
  • 第44章 一些我比较喜欢的统计子程序
  • 译后记
展开全部