图书介绍
数据挖掘实用案例分析pdf电子书版本下载
- 赵卫东,董亮著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302490494
- 出版时间:2018
- 标注页数:252页
- 文件大小:34MB
- 文件页数:264页
- 主题词:数据采集-案例
PDF下载
下载说明
数据挖掘实用案例分析PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 数据分析过程的主要问题 1
1.1业务理解 1
1.2数据理解 2
1.3数据质量问题与预处理 3
1.4数据分析常见陷阱 9
1.5数据分析方法的选择 10
1.5.1分类算法 11
1.5.2聚类算法 15
1.5.3关联分析 16
1.5.4回归分析 17
1.5.5深度学习 19
1.5.6统计方法 19
1.6数据分析结果的评价 19
1.6.1分类算法的评价 20
1.6.2聚类结果的评价 21
1.6.3关联分析的评价 22
1.6.4回归分析结果的评价 22
1.6.5深度学习的评价 23
1.7数据分析团队的组建 24
1.7.1项目经理 24
1.7.2业务专家 24
1.7.3数据工程师 25
1.7.4数据建模人员 25
1.7.5可视化人员 25
1.7.6评估人员 25
1.8数据分析人才培养的难题 26
1.8.1数理要求高 26
1.8.2跨学科综合能力 26
1.8.3国内技术资料少 26
1.8.4实践机会少 27
第2章 数据挖掘算法的选择——保险产品推荐 28
2.1业务理解 28
2.2数据分析目标 29
2.3数据探索 30
2.3.1数据质量评估 30
2.3.2探索数据统计特性 32
2.3.3数据降维 34
2.4模型选择过程 36
2.4.1算法初选 37
2.4.2算法验证 40
2.4.3算法优化 43
2.4.4平衡数据集 43
2.4.5修改模型参数 46
2.5总结 48
第3章 常用可视化的多维分析 50
3.1箱图 51
3.2雷达图 53
3.3标签云 55
3.4气泡图 56
3.5树图 57
3.6地图 58
3.7高低图 59
3.8双轴图 60
3.9关系图 61
3.10热图 63
第4章 SPSS Modeler建模组件介绍 65
4.1数据预处理组件 65
4.1.1数据清理组件 65
4.1.2数据集成组件 66
4.1.3数据选择组件 67
4.1.4数据变换组件 67
4.2数据挖掘建模组件 68
4.2.1模型筛选 68
4.2.2自动建模 68
4.2.3决策树模型 69
4.2.4贝叶斯网络模型 70
4.2.5神经网络模型 70
4.2.6支持向量机模型 71
4.2.7时间序列模型 71
4.2.8统计模型 71
4.2.9聚类模型 73
4.2.10关联分析 73
4.2.11 KNN模型 74
4.2.12数据挖掘模式评估 74
4.3知识表示 74
4.3.1图形节点 75
4.3.2数据输出 75
4.3.3数据导出 76
第5章 香水销售分析 77
5.1香水销售数据预处理 77
5.2香水销售数据统计分析 79
5.3影响香水销量的因素分析 84
5.4香水适用场所关联分析 87
5.5香水聚类分析 89
5.6香水营销建议 92
第6章 银行信用卡欺诈与拖欠行为分析 93
6.1客户信用等级影响因素 94
6.1.1客户信用卡申请数据预处理 94
6.1.2信用卡申请成功影响因素 96
6.2信用卡客户信用等级影响因素 102
6.3基于消费的信用等级影响因素 104
6.4信用卡欺诈判断模型 105
6.4.1基于Apriori算法的欺诈模型 106
6.4.2基于判别的欺诈模型 109
6.4.3基于分类算法的欺诈模型 110
6.5欺诈人口属性分析 114
6.5.1欺诈人口属性统计分析 115
6.5.2基于逻辑回归的欺诈人口属性分析 116
6.5.3逾期还款的客户特征 119
6.5.4基于决策树分析逾期客户特征 120
6.5.5基于回归分析逾期客户特征 123
6.5.6根据消费历史分析客户特征 128
6.5.7基于聚类分析客户特征 128
6.5.8基于客户细分的聚类分析 134
第7章 海底捞火锅运营分析 138
7.1火锅相关数据抓取 139
7.2数据预处理 140
7.3数据分析 145
7.3.1海底捞运营分析 145
7.3.2店铺选址分析 148
7.4菜品关联分析 153
7.5用户评论与评分的关联分析 160
7.6顾客情感分析 168
第8章 商务宾馆竞争分析 172
8.1目前经济型酒店行业竞争态势 172
8.2用户相关数据准备 174
8.3通过Python编程抓取评论 180
8.4数据预处理 183
8.5商务宾馆客户数据分析 184
8.5.1酒店评分影响因素 184
8.5.2酒店评分与酒店业绩关系 187
8.5.3酒店评分分析 189
8.5.4客户情感分析 198
8.5.5竞争分析 205
8.6建议 214
第9章 耐热导线工厂质量管理数据分析 215
9.1项目概述 215
9.2耐热导线生产质量数据预处理 216
9.3耐热铝线质量检测数据分析 218
第10章 基于逻辑回归模型的高危人员分析 225
10.1高危人员分析需求 226
10.2高危人群相关数据收集与预处理 226
10.3建立模型 229
第11章 卷积神经网络在音频质量评价领域的应用 236
11.1深度学习基础 236
11.1.1深度学习的发展过程 237
11.1.2深度学习常用技术框架 237
11.1.3常用的深度学习算法 239
11.2音频质量评价 241
11.2.1音频样本及特征预处理 242
11.2.2音频特征选择 244
11.2.3卷积神经网络模型训练 245
11.2.4模型参数调优 248
11.3性能验证 249
参考文献 251