图书介绍

数据挖掘 商业数据分析技术与实践pdf电子书版本下载

数据挖掘  商业数据分析技术与实践
  • (美)盖丽特·徐茉莉(Galit Shmueli)著 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302497660
  • 出版时间:2018
  • 标注页数:399页
  • 文件大小:56MB
  • 文件页数:416页
  • 主题词:商业信息-数据处理

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页 直链下载[便捷但速度慢]   [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘 商业数据分析技术与实践PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第一部分 预备知识 2

1 导论 2

1.1 什么是商业分析? 2

1.2 什么是数据挖掘? 4

1.3 数据挖掘及相关用语 4

1.4 大数据 5

1.5 数据科学 6

1.6 为什么会有这么多不同的方法? 7

1.7 术语和符号 7

1.8 本书框架 9

2 数据挖掘概述 13

2.1 引言 13

2.2 数据挖掘的核心思想 14

2.3 数据挖掘步骤 16

2.4 初步步骤 18

2.5 预测能力和过拟合 24

2.6 用JMP Pro建立预测模型 29

2.7 用JMP Pro进行数据挖掘 36

2.8 自动化数据挖掘解决方案 37

第二部分 数据探索与降维 46

3 数据可视化 46

3.1 数据可视化的用途 46

3.2 数据实例 47

3.3 基本图形:条形图、折线图和散点图 49

3.4 多维可视化 56

3.5 特殊可视化 68

3.6 基于数据挖掘目标的主要可视化方案和操作概要 72

4 降维 76

4.1 引言 76

4.2 维度灾难 77

4.3 实际考虑 77

4.4 数据汇总 78

4.5 相关分析 82

4.6 减少分类变量中的类别数量 82

4.7 将分类型变量转换为连续型变量 84

4.8 主成分分析 84

4.9 利用回归模型降维 94

4.10 利用分类和回归树降维 94

第三部分 性能评估 98

5 评估预测效果 98

5.1 引言 98

5.2 评价预测性能 99

5.3 评判分类效果 101

5.4 评判分类性能 112

5.5 过采样 115

第四部分 预测与分类方法 122

6 多元线性回归 122

6.1 引言 122

6.2 解释模型与预测模型 123

6.3 估计回归方程和预测 124

6.4 线性回归中的变量选择 129

7 k近邻法 142

7.1 k-NN分类(分类型结果变量) 142

7.2 数值型结果变量下的k-NN方法 147

7.3 k-NN算法的优点和缺点 149

8 朴素贝叶斯分类器 153

8.1 引言 153

8.2 使用完全(精确)贝叶斯分类器 155

8.3 朴素贝叶斯方法的优点和缺点 163

9 分类和回归树 168

9.1 引言 168

9.2 分类树 169

9.3 生成树 172

9.4 评估分类树的效果 176

9.5 避免过拟合 178

9.6 树中的分类准则 181

9.7 多分类的分类树 182

9.8 回归树 182

9.9 树的优点和缺点 184

9.10 预测方法的提高:组合多棵树 186

9.11 不纯度的提取和度量 188

10 逻辑回归 193

10.1 引言 193

10.2 逻辑回归模型 195

10.3 评价分类性能 202

10.4 完整分析案例:预测航班延误 205

10.5 附录:逻辑回归的概括 214

11 神经网络 225

11.1 引言 225

11.2 神经网络的概念和结构 226

11.3 拟合数据 226

11.4 JMP Pro用户输入 240

11.5 探索预测变量和响应变量的关系 242

11.6 神经网络的优点和缺陷 243

12 判别分析 247

12.1 引言 247

12.2 观测值到类的距离 249

12.3 从距离到倾向和分类 251

12.4 判别分析的分类性能 254

12.5 先验概率 255

12.6 多类别分类 256

12.7 优点和缺点 258

13 组合方法:集成算法和增量模型 263

13.1 集成算法 263

13.2 增量(说服)模型 268

13.3 总结 274

第五部分 挖掘记录之间的关系 280

14 聚类分析 280

14.1 引言 280

14.2 定义两个观测值之间的距离 284

14.3 定义两个类之间的距离 288

14.4 系统(凝聚)聚类 290

14.5 非系统聚类:k-means算法 299

第六部分 时间序列预测 310

15 时间序列处理 310

15.1 引言 310

15.2 描述性与预测性建模 311

15.3 商业中的主流预测方法 312

15.4 时间序列的构成 312

15.5 数据分割和性能评价 316

16 回归预测模型 321

16.1 趋势模型 321

16.2 季节模型 327

16.3 趋势和季节模型 330

16.4 自相关和ARIMA模型 331

17 平滑法 350

17.1 引言 350

17.2 移动平均法 351

17.3 简单指数平滑法 355

17.4 高级指数平滑法 358

第七部分 案例 372

18 案例 372

18.1 查尔斯图书俱乐部 372

18.2 德国信贷 378

18.3 太古软件编目 382

18.4 政治说教 385

18.5 出租车订单取消 388

18.6 浴皂的消费者细分 390

18.7 直邮筹款 393

18.8 破产预测 395

18.9 时间序列案例:预测公共交通需求 398

精品推荐