图书介绍

数据挖掘学习方法pdf电子书版本下载

数据挖掘学习方法
  • 王玲编著 著
  • 出版社: 北京:冶金工业出版社
  • ISBN:9787502475451
  • 出版时间:2017
  • 标注页数:135页
  • 文件大小:28MB
  • 文件页数:146页
  • 主题词:数据采集-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页 直链下载[便捷但速度慢]   [在线试读本书]   [在线获取解压码]

下载说明

数据挖掘学习方法PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 数据挖掘概述 1

1.1 数据挖掘的定义及含义 2

1.2 数据挖掘的作用 2

1.3 数据挖掘和数据仓库 3

1.4 数据挖掘和在线分析处理 4

1.5 数据挖掘、机器学习和统计 5

1.6 软硬件发展对数据挖掘的影响 5

1.7 数据挖掘的类型和研究内容 6

1.7.1 描述性数据挖掘 6

1.7.2 预测性数据挖掘 7

思考题与习题 8

第2章 数据仓库 9

2.1 什么是数据仓库 9

2.1.1 数据仓库的定义与基本特性 9

2.1.2 操作数据库系统与数据仓库的区别 10

2.1.3 为什么要建立数据仓库 11

2.2 数据仓库的一般结构 12

2.2.1 体系结构 12

2.2.2 数据仓库的运行结构 13

2.2.3 事实表和维表 14

2.2.4 数据组织结构 15

2.3 多维数据的分析 16

2.3.1 数据立方体 16

2.3.2 多维数据分析的基本操作 16

2.4 数据仓库的分析与设计 17

2.4.1 需求分析 17

2.4.2 数据仓库的概念模型 18

2.4.3 数据仓库的逻辑模型 19

2.4.4 数据仓库的物理模型 21

2.4.5 数据仓库的元数据模型 23

2.4.6 数据仓库的索引构建 24

2.5 数据仓库的开发过程 25

2.5.1 数据仓库的螺旋式开发方法 26

2.5.2 数据仓库的开发策略 26

思考题与习题 27

第3章 聚类 28

3.1 K-均值算法 28

3.1.1 优化目标 29

3.1.2 随机初始化 30

3.1.3 选择聚类数 30

3.2 层次聚类算法 30

3.3 SOM聚类算法 31

3.4 FCM聚类算法 32

3.5 几种聚类算法的分析 32

思考题与习题 34

第4章 关联规则挖掘 35

4.1 关联规则挖掘 35

4.1.1 关联规则提出背景 35

4.1.2 关联规则的基本概念 35

4.1.3 关联规则的分类 36

4.2 关联规则挖掘的相关算法 37

4.2.1 Apriori算法预备知识 37

4.2.2 Apriori算法的核心思想 37

4.2.3 Apriori算法描述 38

4.2.4 Apriori算法评价 38

4.2.5 Apriori算法改进 39

4.2.6 频繁模式树算法 40

4.3 关联规则的应用 40

4.3.1 关联规则挖掘技术在国内外的应用现状 40

4.3.2 关联规则在大型超市中应用的步骤 41

思考题与习题 43

第5章 决策树算法 46

5.1 决策树算法概述 46

5.2 决策树表示法 47

5.3 决策树学习的学习过程 47

5.4 基本的决策树学习算法 48

5.5 ID3算法的基本原理 49

5.5.1 用熵度量样例的均一性 49

5.5.2 用信息增益度量期望的熵降低 49

5.6 C4.5算法的基本原理 50

5.6.1 信息增益比选择最佳特征 50

5.6.2 处理连续数值型特征 51

5.6.3 叶子裁剪 51

思考题与习题 52

第6章 逻辑回归 54

6.1 分类问题 54

6.2 分类问题建模 54

6.3 判定边界 56

6.4 代价函数 56

6.5 多类分类 58

6.6 类偏斜的误差度量 59

6.7 查全率和查准率之间的权衡 59

思考题与习题 60

第7章 多变量线性回归 61

7.1 多维特征 61

7.2 多变量梯度下降 62

7.3 特征缩放 63

7.4 学习率 63

思考题与习题 64

第8章 神经网络 65

8.1 神经网络概述 66

8.2 神经网络模型的构建 67

8.3 神经网络示例 69

8.4 神经网络的代价函数 70

8.5 反向传播算法 71

8.6 梯度检验 73

8.7 综合 74

思考题与习题 74

第9章 支持向量机 76

9.1 优化目标 76

9.2 支持向量机判定边界 78

9.3 核函数 79

9.4 逻辑回归与支持向量机 82

9.5 支持向量回归 82

9.5.1 函数管道思想与不敏感函数 82

9.5.2 线性回归 83

9.5.3 非线性回归 85

思考题与习题 85

第10章 降维 87

10.1 数据压缩 87

10.1.1 将数据从二维降至一维 87

10.1.2 将数据从三维降至二维 88

10.2 数据可视化 88

10.3 主要成分分析 89

10.4 主要成分分析算法 90

10.5 选择主要成分的数量 91

10.6 应用主要成分分析 92

思考题与习题 93

第11章 异常检测 95

11.1 异常点的密度估计 95

11.2 异常检测 96

11.3 评价一个异常检测系统 97

11.4 异常检测与监督学习对比 98

11.5 选择特征 98

11.6 多元高斯分布 99

思考题与习题 101

第12章 推荐系统 102

12.1 问题形式化 102

12.2 基于内容的推荐系统 103

12.3 协同过滤算法 104

12.4 均值归一化 105

思考题与习题 106

第13章 大规模数据挖掘算法 107

13.1 大型数据集的学习 107

13.2 随机梯度下降法 108

13.3 微型批量梯度下降 109

13.4 随机梯度下降收敛 109

13.5 在线学习 110

13.6 映射化简和数据并行 111

思考题与习题 112

第14章 数据挖掘算法的案例分析 113

14.1 R语言的简介 113

14.2 案例:基于回归树预测海藻数量及分析水样化学参数 115

14.2.1 挖掘目标的提出 115

14.2.2 模型数据的分析 115

14.2.3 建模与仿真 123

14.2.4 编程代码 130

思考题与习题 134

参考文献 135

精品推荐