图书介绍

数据挖掘导论pdf电子书版本下载

数据挖掘导论
  • 戴红,常子冠,于宁主编 著
  • 出版社: 北京:清华大学出版社
  • ISBN:9787302381044
  • 出版时间:2015
  • 标注页数:208页
  • 文件大小:46MB
  • 文件页数:219页
  • 主题词:数据采集-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
下载压缩包 [复制下载地址] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页

下载说明

数据挖掘导论PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 认识数据挖掘 1

1.1 数据挖掘的定义 1

1.2 机器学习 2

1.2.1 概念学习 2

1.2.2 归纳学习 3

1.2.3 有指导的学习 4

1.2.4 无指导的聚类 7

1.3 数据查询 8

1.4 专家系统 8

1.5 数据挖掘的过程 9

1.5.1 准备数据 10

1.5.2 挖掘数据 10

1.5.3 解释和评估数据 10

1.5.4 模型应用 11

1.6 数据挖掘的作用 11

1.6.1 分类 11

1.6.2 估计 12

1.6.3 预测 12

1.6.4 无指导聚类 12

1.6.5 关联关系分析 13

1.7 数据挖掘技术 13

1.7.1 神经网络 14

1.7.2 回归分析 14

1.7.3 关联分析 15

1.7.4 聚类技术 16

1.8 数据挖掘的应用 16

1.8.1 应用领域 16

1.8.2 成功案例 18

1.9 Weka数据挖掘软件 19

1.9.1 Weka简介 19

1.9.2 使用Weka建立决策树模型 22

1.9.3 使用Weka进行聚类 25

1.9.4 使用Weka进行关联分析 26

本章小结 27

习题 28

第2章 基本数据挖掘技术 30

2.1 决策树 30

2.1.1 决策树算法的一般过程 31

2.1.2 决策树算法的关键技术 32

2.1.3 决策树规则 40

2.1.4 其他决策树算法 41

2.1.5 决策树小结 41

2.2 关联规则 42

2.2.1 关联规则概述 42

2.2.2 关联分析 43

2.2.3 关联规则小结 46

2.3 聚类分析技术 47

2.3.1 K-means算法 48

2.3.2 K-means算法小结 51

2.4 数据挖掘技术的选择 51

本章小结 52

习题 53

第3章 数据库中的知识发现 55

3.1 知识发现的基本过程 55

3.1.1 KDD过程模型 55

3.1.2 知识发现软件 57

3.1.3 KDD过程的参与者 58

3.2 KDD过程模型的应用 58

3.2.1 步骤1:商业理解 58

3.2.2 步骤2:数据理解 59

3.2.3 步骤3:数据准备 60

3.2.4 步骤4:建模 65

3.2.5 评估 66

3.2.6 部署和采取行动 66

3.3 实验:KDD案例 66

本章小结 72

习题 73

第4章 数据仓库 74

4.1 数据库与数据仓库 74

4.1.1 数据(库)模型 75

4.1.2 规范化与反向规范化 77

4.2 设计数据仓库 79

4.2.1 数据抽取、清洗、变换和加载 79

4.2.2 数据仓库模型 82

4.2.3 数据集市 85

4.2.4 决策支持系统 86

4.3 联机分析处理 87

4.3.1 概述 87

4.3.2 实验:使用OLAP辅助驾驶员行为分析 90

4.4 使用Excel数据透视表和数据透视图分析数据 93

4.4.1 创建简单数据透视表和透视图 93

4.4.2 创建多维透视表和透视图 97

本章小结 100

习题 100

第5章 评估技术 102

5.1 数据挖掘评估概述 102

5.1.1 评估内容 102

5.1.2 评估工具 103

5.2 评估有指导学习模型 108

5.2.1 评估分类类型输出模型 108

5.2.2 评估数值型输出模型 109

5.2.3 计算检验集置信区间 111

5.2.4 无指导聚类技术的评估作用 112

5.3 比较有指导学习模型 112

5.3.1 使用Lift比较模型 112

5.3.2 通过假设检验比较模型 114

5.4 属性评估 115

5.4.1 数值型属性的冗余检查 115

5.4.2 数值属性显著性的假设检验 117

5.5 评估无指导聚类模型 118

本章小结 118

习题 119

第6章 神经网络技术 120

6.1 神经网络概述 120

6.1.1 神经网络模型 120

6.1.2 神经网络的输入和输出数据格式 121

6.1.3 激励函数 123

6.2 神经网络训练 124

6.2.1 反向传播学习 124

6.2.2 自组织映射的无指导聚类 127

6.2.3 实验:应用BP算法建立前馈神经网络 130

6.3 神经网络模型的优势和缺点 138

本章小结 138

习题 139

第7章 统计技术 141

7.1 回归分析 141

7.1.1 线性回归分析 142

7.1.2 非线性回归 149

7.1.3 树回归 151

7.2 贝叶斯分析 152

7.3 聚类技术 156

7.3.1 分层聚类 156

7.3.2 基于模型的聚类 163

7.4 数据挖掘中的统计技术与机器学习技术 165

本章小结 165

习题 167

第8章 时间序列和基于Web的数据挖掘 169

8.1 时间序列分析 169

8.1.1 概述 169

8.1.2 线性回归分析解决时间序列问题 173

8.1.3 神经网络技术解决时间序列问题 175

8.2 基于Web的数据挖掘 176

8.2.1 概述 176

8.2.2 Web文本挖掘 178

8.2.3 Web使用挖掘 179

8.3 多模型分类技术 185

8.3.1 装袋技术 185

8.3.2 推进技术 185

本章小结 186

习题 187

附录A 词汇表 188

附录B 数据挖掘数据集 201

参考文献 208

精品推荐