图书介绍
数据仓库与数据挖掘技术 第2版pdf电子书版本下载
- 夏火松主编 著
- 出版社: 北京:科学出版社
- ISBN:9787030129345
- 出版时间:2009
- 标注页数:295页
- 文件大小:19MB
- 文件页数:310页
- 主题词:数据库系统-高等学校-教材;数据采集-高等学校-教材
PDF下载
下载说明
数据仓库与数据挖掘技术 第2版PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据仓库与数据挖掘概述 1
1.1 数据仓库引论 1
1.1.1 为什么要建立数据仓库 1
1.1.2 什么是数据仓库 2
1.1.3 数据仓库的特点 6
1.1.4 数据进入数据仓库的基本过程与建立数据仓库的步骤 10
1.1.5 分析数据仓库的内容 11
1.2 数据挖掘引论 12
1.2.1 为什么要进行数据挖掘 12
1.2.2 什么是数据挖掘 16
1.2.3 数据挖掘的特点 19
1.2.4 数据挖掘的基本过程与步骤 20
1.2.5 分析数据挖掘的内容 24
1.3 数据挖掘与数据仓库的关系 25
1.4 数据仓库与数据挖掘的应用 28
1.4.1 数据挖掘在零售业的应用 28
1.4.2 数据挖掘在商业银行中的应用 33
1.4.3 数据挖掘在电信部门的应用 36
1.4.4 数据挖掘在贝斯出口公司的应用 38
1.4.5 数据挖掘如何预测信用卡欺诈 38
1.4.6 数据挖掘在证券行业的应用 40
思考练习题 40
第2章 数据仓库的分析 42
2.1 数据仓库的需求分析模型 42
2.2 影响数据仓库成功的因素 43
2.3 数据仓库的生命周期 45
2.3.1 数据仓库计划与准备阶段 45
2.3.2 数据仓库的其他阶段 52
2.4 数据仓库的基本体系结构 53
2.5 数据仓库的逻辑结构 56
2.5.1 数据仓库中的粒度 56
2.5.2 数据仓库中的数据分割 57
2.5.3 数据仓库中的数据组织 57
2.5.4 数据仓库中的快照 58
2.5.5 数据仓库中的元数据 58
思考练习题 59
第3章 数据仓库的设计与实施 60
3.1 设计科学与数据仓库的设计 60
3.2 从数据库到数据仓库 61
3.3 面向主题的数据仓库设计 62
3.3.1 数据建模 62
3.3.2 星型连接 63
3.3.3 数据仓库的数据模型设计 70
3.4 开发数据仓库的物理设计 72
3.4.1 数据仓库设计工具的选择 72
3.4.2 物理数据模型设计 73
3.4.3 数据仓库中数据表的数量与规范化 74
3.5 数据仓库的实施 74
3.5.1 数据仓库的实施应注意的问题 74
3.5.2 在实施数据仓库过程中应避免的错误 75
3.5.3 数据仓库项目实施成功的要诀 77
思考练习题 81
第4章 信息分析的基本技术 83
4.1 自动信息分析的基本技术 83
4.1.1 智能代理 83
4.1.2 群体智能 85
4.1.3 小波分析 88
4.1.4 分形技术分析 91
4.2 联机分析 91
4.2.1 联机分析OLAP的基本术语 93
4.2.2 OLAP体系结构和处理的特性 94
4.2.3 OLAP多维数据结构与OLAP的分类 94
4.2.4 OLAP的多维数据分析方法 95
4.2.5 OLAP评价准则 97
4.2.6 OLAP的发展与流行的OLAP工具选择 100
4.3 Rough的信息分析技术 101
4.3.1 粗糙集理论的基本概念和理论基础 102
4.3.2 粗糙集在信息分析中的特征表示 103
思考练习题 105
第5章 数据挖掘过程 106
5.1 数据挖掘的方法与基本流程 106
5.1.1 SEMMA方法 106
5.1.2 数据挖掘的基本流程 107
5.2 确定主题和定义数据挖掘任务 108
5.2.1 确定主题 109
5.2.2 定义数据挖掘任务 110
5.3 数据预处理 111
5.3.1 数据的收集和准备 111
5.3.2 数据清理 112
5.3.3 数据集成 113
5.3.4 数据变换 114
5.3.5 数据归约 115
5.3.6 微软数据转换服务 115
5.4 数据挖掘的模型建立与理解 116
5.4.1 关于模型的准确性 118
5.4.2 关于模型的可理解性 118
5.4.3 关于模型的性能 119
5.4.4 描述和可视化 119
5.4.5 验证与评估 120
5.5 数据挖掘中常见的一些问题 122
5.5.1 商业用户提出的问题 122
5.5.2 技术问题 122
5.5.3 数据挖掘应用问题 122
5.5.4 实施数据挖掘项目考虑的问题 123
5.5.5 数据挖掘对社会的影响——有关隐私问题 123
5.6 事先无法预测的有价值知识 124
思考练习题 124
第6章 数据挖掘基本算法 125
6.1 分类规则挖掘 125
6.1.1 分类与估值 125
6.1.2 决策树 128
6.1.3 贝叶斯分类 135
6.2 预测分析与趋势分析规则 139
6.2.1 预言的基本方法 139
6.2.2 定量分析预测 140
6.2.3 预测的结果分析 142
6.2.4 趋势分析挖掘 143
6.3 数据挖掘的关联算法 144
6.3.1 关联规则的概念及分类 144
6.3.2 简单形式的关联规则算法(单维、单层和布尔关联规则) 148
6.3.3 多层和多维关联规则的挖掘 152
6.3.4 货篮子分析存在的问题 155
6.3.5 关联分析的其他算法 157
6.3.6 挖掘序列模式 160
6.4 数据挖掘的聚类算法 164
6.4.1 聚类分析的概念与分类 166
6.4.2 聚类分析中两个对象之间的相异度计算方法 171
6.4.3 划分方法 177
6.4.4 层次方法 181
6.4.5 基于密度的方法 186
6.4.6 基于网格的方法 188
6.4.7 基于模型的聚类方法 191
6.4.8 模糊聚类算法 192
6.5 数据挖掘的统计分析算法 193
6.5.1 辨别分析 193
6.5.2 回归建模 193
6.5.3 优点和缺点 194
6.6 数据挖掘的品种优化算法 194
6.6.1 品种优化 194
6.6.2 品种优化的算法 196
6.7 数据挖掘的进化算法 199
6.7.1 遗传算法 199
6.7.2 数据挖掘的神经网络算法 200
思考练习题 204
第7章 非结构化数据挖掘 206
7.1 文本挖掘 206
7.1.1 文本挖掘的一般过程与应用 207
7.1.2 文本表示与预处理 208
7.1.3 文本分类方法与文本聚类方法 212
7.1.4 自动摘要方法 213
7.2 Web数据挖掘 213
7.2.1 非结构化Web数据源 214
7.2.2 Web挖掘分类 219
7.2.3 Web内容挖掘 221
7.2.4 Web结构挖掘 222
7.2.5 Web访问挖掘 222
7.2.6 利用Web日志的聚类算法 225
7.2.7 电子商务中的Web挖掘 227
7.3 空间群数据挖掘 230
7.3.1 空间数据挖掘的概念 230
7.3.2 空间数据挖掘的分类 231
7.3.3 空间数据挖掘的体系结构 232
7.4 多媒体数据挖掘 232
7.4.1 多媒体数据挖掘的概念 232
7.4.2 多媒体数据挖掘的分类 233
7.4.3 多媒体数据挖掘的体系结构 233
思考练习题 234
第8章 离群数据挖掘 235
8.1 离群数据挖掘的概念 235
8.2 离群数据挖掘的分类 236
8.3 离群数据挖掘的算法 237
8.3.1 基于统计的方法 237
8.3.2 基于距离的离群数据方法 239
8.3.3 基于偏离的离群数据挖掘 241
8.3.4 高维数据的离群数据挖掘 243
8.3.5 基于小波的离群数据挖掘 244
8.4 市场营销离群数据挖掘 247
8.4.1 市场营销离群数据的特点 247
8.4.2 基于分形的市场营销离群数据挖掘模型 248
思考练习题 250
第9章 数据挖掘语言与工具的选择 251
9.1 数据挖掘语言及其标准化 251
9.1.1 数据挖掘语言的分类 251
9.1.2 分析与评价 257
9.2 数据挖掘的研究热点 257
9.3 数据挖掘工具的选择 258
9.3.1 评价数据挖掘工具的优劣指标 259
9.3.2 通用数据挖掘产品与工具 260
9.3.3 国内的数据挖掘产品与工具 273
9.3.4 数据可视化工具的选择 275
9.3.5 数据挖掘网站与可获得的数据挖掘算法源代码 276
思考练习题 278
第10章 知识管理与知识管理系统 279
10.1 知识管理 279
10.1.1 知识 279
10.1.2 知识管理的定义 280
10.1.3 有效的知识管理 281
10.2 知识管理系统 284
10.2.1 知识管理共享的条件 285
10.2.2 知识管理共享的困难 285
10.2.3 知识管理的激励机制 286
10.2.4 知识管理的体系结构 289
思考练习题 291
附录 数据挖掘产品部分信息 292
参考文献 294