图书介绍
数据仓库工具箱 面向SQL Server2005和Microsoft商业智能工具集pdf电子书版本下载
- (美)曼蒂,桑斯维特,金伯尔著 著
- 出版社: 北京:清华大学出版社
- ISBN:7302163790
- 出版时间:2007
- 标注页数:566页
- 文件大小:104MB
- 文件页数:597页
- 主题词:数据库系统
PDF下载
下载说明
数据仓库工具箱 面向SQL Server2005和Microsoft商业智能工具集PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第Ⅰ部分 需求、实施和体系结构第1章 定义业务需求 3
1.1 长期成功的最重要的决定因素 4
1.2 揭示业务价值 4
1.2.1 获得赞助商关系 5
1.2.2 定义企业级业务需求 5
1.2.3 区分优先级过程 13
1.2.4 项目规划 15
1.2.5 收集项目需求 15
1.3 业务需求示例:Adventure Works Cycles 16
1.3.1 Adventure Works Cycles公司的采访准备 17
1.3.2 Adventure Works Cycles企业业务需求 19
1.3.3 分析主题和业务过程 23
1.3.4 Adventure Works Cycles总线矩阵 25
1.3.5 Adventure Works Cycles区分优先级过程 26
1.3.6 订单项目的业务需求 27
1.4 小结 27
第2章 业务过程维度模型设计 29
2.1 维度建模概念和术语 30
2.1.1 事实表 31
2.1.2 维度 32
2.1.3 整合事实和维度 33
2.1.4 总线矩阵、一致性维度和交叉探查 34
2.2 其他设计概念和技术 37
2.2.1 代理键 37
2.2.2 渐变维度 38
2.2.3 日期 42
2.2.4 退化维度 43
2.2.5 雪花模型 43
2.2.6 多对多维度或者多值维度 44
2.2.7 层次结构 46
2.2.8 异构产品 47
2.2.9 聚合维度 48
2.2.10 无意义维度 50
2.2.11 三种事实表类型 51
2.2.12 聚合 52
2.3 维度建模过程 53
2.3.1 准备工作 55
2.3.2 数据记录和研究 59
2.3.3 构建维度模型 62
2.3.4 开发详细维度模型 66
2.3.5 模型测试 67
2.3.6 评审和确认模型 68
2.4 案例研究:创建Adventure Works Cycles订单维度模型 68
2.4.1 选择维度 68
2.4.2 确定订单业务过程的维度和事实属性 73
2.4.3 初始模型的最终草图 74
2.4.4 问题列表 75
2.4.5 详细维度模型开发 75
2.4.6 最终维度模型 77
2.5 小结 77
第3章 工具集 79
3.1 Microsoft DW/BI工具集 80
3.2 使用Microsoft工具集的原因 81
3.3 Microsoft DW/BI系统的体系结构 81
3.3.1 包含Analysis Services的原因 83
3.3.2 关于Analysis Services的争论 84
3.3.3 存储在关系数据库中的原因 85
3.4 Microsoft工具概述 85
3.4.1 需要的产品 86
3.4.2 SQL Server2005开发和管理工具 88
3.5 小结 92
第Ⅱ部分 开发和填充数据库 95
第4章 设置和物理设计 95
4.1 系统规模考虑事项 96
4.1.1 计算数据卷 96
4.1.2 确定应用复杂度 97
4.1.3 估计并发用户数 99
4.1.4 评估系统可用性需求 99
4.2 系统配置考虑 100
4.2.1 需要的内存 100
4.2.2 集成式还是分布式 100
4.2.3 使用的存储系统 102
4.2.4 处理器 103
4.2.5 高可用性配置 104
4.3 软件安装和配置 105
4.3.1 开发环境软件需求 106
4.3.2 测试和产品系统软件需求 109
4.3.3 操作系统 109
4.3.4 SQL Server关系数据库设置 110
4.3.5 Analysis Services设置 113
4.3.6 Integration Services设置 114
4.3.7 Reporting Services设置 115
4.4 物理数据仓库数据库设计 116
4.4.1 代理键 117
4.4.2 字符串列 117
4.4.3 空或非空 118
4.4.4 插入未知成员行 118
4.4.5 数据表和列的扩展属性 118
4.4.6 常规事务列 118
4.4.7 索引和列约束条件 119
4.4.8 创建数据表视图 121
4.4.9 事实表分区 122
4.4.10 聚合数据表 128
4.4.11 中间表 129
4.4.12 元数据设置 129
4.5 小结 129
第5章 设计ETL系统 131
5.1 SQL Server Integration Services简介 132
5.1.1 BI Studio Integration Services工具概述 133
5.1.2 控制流 134
5.1.3 数据流 136
5.1.4 动态程序包概念 141
5.1.5 事件处理程序 143
5.2 高级计划 144
5.2.1 开发第一个概要性高级映射 144
5.2.2 构建沙箱源系统 146
5.2.3 执行数据记录 147
5.2.4 完成源到目的的映射 147
5.2.5 加载频率 148
5.2.6 多少历史信息 148
5.2.7 使用分区 149
5.2.8 历史加载和增量加载 150
5.2.9 开发提取数据的策略 151
5.2.10 人员和机构的重复数据删除 155
5.2.11 开发维度分布的策略 156
5.3 更新Analysis Services数据库 157
5.4 ETL系统物理设计 158
5.4.1 系统体系结构和Integration Services 158
5.4.2 中间表区域 159
5.4.3 程序包存储 159
5.4.4 程序包命名约定 160
5.5 开发详细的规范 160
5.6 小结 162
第6章 开发ETL系统 163
6.1 起始 164
6.1.1 创建解决方案、项目和数据源 165
6.1.2 程序包模板 166
6.1.3 主程序包和子程序包 167
6.2 维度处理 169
6.2.1 维度处理的基本要求 169
6.2.2 提取修改后的记录 176
6.2.3 渐变维度 178
6.2.4 重复数据删除和模糊变换 186
6.3 事实处理 188
6.3.1 提取事实数据 188
6.3.2 提取事实的更新和删除 190
6.3.3 清除事实数据 191
6.3.4 检查数据质量及暂停程序的执行 192
6.3.5 转换事实数据 197
6.3.6 代理键管道 200
6.3.7 加载事实数据 203
6.3.8 Analysis Services的处理过程 208
6.4 补充介绍 208
6.4.1 审核系统 208
6.4.2 主程序包 211
6.4.3 程序包事件处理 214
6.4.4 单元测试 214
6.5 小结 215
第7章 设计Analysis Services OLAP数据库 217
7.1 选择Analysis Services的原因 218
7.1.1 聚合管理 218
7.1.2 聚合导航 219
7.1.3 针对每种度量的求和逻辑 219
7.1.4 查询性能 220
7.1.5 计算 220
7.1.6 使用Analysis Services的其他原因 220
7.1.7 不使用Analysis Services的原因 222
7.2 设计OLAP结构 223
7.2.1 起始 223
7.2.2 创建项目和数据源视图 226
7.2.3 维度设计 229
7.2.4 创建和编辑维度 232
7.2.5 创建和编辑多维数据集 242
7.3 物理设计的考虑因素 256
7.3.1 存储模式:MOLAP、HOLAP、ROLAP 257
7.3.2 设计聚合 258
7.3.3 分区计划 259
7.3.4 部署计划 261
7.3.5 历史处理计划 261
7.3.6 增量处理计划 262
7.4 小结 265
第Ⅲ部分 商业智能应用程序的开发第8章 商业智能应用程序 269
8.1 商业智能的基本概念 270
8.1.1 标准报表 271
8.1.2 分析应用程序 271
8.1.3 BI应用程序开发人员 272
8.2 商业智能应用程序的价值 274
8.3 交付平台选项 275
8.4 BI应用程序的开发过程 276
8.4.1 应用程序的说明 276
8.4.2 应用程序的开发 284
8.4.3 维护 288
8.5 小结 289
第9章 在Reporting Services中构建BI应用程序 291
9.1 报表高层次的体系结构 292
9.1.1 回顾报表的业务需求 293
9.1.2 Reporting Services的体系结构 295
9.1.3 使用Reporting Services作为一个标准的报表工具 297
9.1.4 Reporting Services的评价 303
9.2 报表的构建和传送 304
9.2.1 规划和准备 304
9.2.2 创建报表 306
9.2.3 BI门户 316
9.2.4 报表的运行 320
9.3 小结 322
第10章 数据挖掘的加入 325
10.1 数据挖掘的定义 326
10.1.1 基本的数据挖掘的术语 327
10.1.2 数据挖掘的业务应用 328
10.1.3 角色和责任 334
10.2 SQL Server数据挖掘体系结构的概述 334
10.2.1 数据挖掘设计环境 335
10.2.2 构建、部署和处理 336
10.2.3 挖掘模型的访问 336
10.2.4 Integration Services和数据挖掘 337
10.2.5 额外的功能 337
10.2.6 体系结构的总结 338
10.3 Microsoft数据挖掘的算法 338
10.3.1 决策树 339
10.3.2 贝叶斯算法 340
10.3.3 聚类 341
10.3.4 顺序分析和聚类分析 341
10.3.5 时间序列 341
10.3.6 关联 341
10.3.7 神经网络 342
10.4 数据挖掘的过程 342
10.4.1 业务阶段 343
10.4.2 数据挖掘阶段 344
10.4.3 运行阶段 350
10.4.4 元数据 351
10.5 数据挖掘的示例 352
10.5.1 示例学习:给城市分类 352
10.5.2 案例研究:产品推荐 360
10.6 小结 375
第Ⅳ部分 DW/BI系统的部署和管理第11章 使用现有的数据仓库进行工作 379
11.1 事情的现状 379
11.1.1 数据质量 380
11.1.2 集市混乱 381
11.1.3 业务认可的混乱 381
11.1.4 基础设施的混乱 382
11.1.5 行政和机构上的问题 382
11.1.6 完全健康 383
11.2 从SQL Server 2000转换到SQL Server 2005 383
11.2.1 关系数据仓库 383
11.2.2 Integration Services 384
11.2.3 Analysis Services 384
11.2.4 Reporting Services 385
11.2.5 数据挖掘 385
11.3 与非SQL Server 2005组件的集成 385
11.3.1 关系数据库的替换 386
11.3.2 Integration Services的替换 387
11.3.3 Analysis Services OLAP、数据挖掘或Reporting Services的替换 388
11.3.4 非Microsoft的即席查询工具的使用 388
11.4 小结 390
第12章 安全 391
12.1 确定安全管理员 392
12.2 保护硬件 393
12.3 保护操作系统 393
12.4 保护开发环境 394
12.5 保护数据 395
12.5.1 向内部用户提供开放的访问 395
12.5.2 分条列出敏感数据 396
12.5.3 保护各种类型的数据访问 396
12.5.4 您该做些什么 401
12.5.5 Windows集成安全认证 402
12.5.6 Analysis Services的安全 403
12.5.7 关系DW的安全 412
12.5.8 Reporting Services安全 419
12.5.9 Integration Services安全 421
12.6 使用情况的监控 422
12.7 保护隐私 422
12.8 小结 423
第13章 元数据规划 425
13.1 元数据的基础 426
13.1.1 元数据的目标 426
13.1.2 元数据的存储空间 427
13.2 元数据标准 428
13.3 SQL Server 2005元数据 430
13.3.1 Cross-Tool组件 434
13.3.2 关系引擎的元数据 434
13.3.3 Analysis Services 435
13.3.4 Integration Services 436
13.3.5 Reporting Services 436
13.3.6 外部元数据的源 437
13.3.7 对SQL Server元数据的期待 438
13.4 实用的元数据方法 438
13.4.1 元数据策略的创建 439
13.4.2 业务元数据报表 440
13.4.3 过程元数据报表 448
13.4.4 技术元数据报表 449
13.4.5 过程元数据的管理 449
13.4 小结 449
第14章 部署 451
14.1 系统部署 452
14.1.1 部署前的测试 452
14.1.2 部署 465
14.2 数据仓库和BI文档 472
14.2.1 核心的说明 472
14.2.2 额外的文档 473
14.2.3 额外的功能 474
14.3 用户的培训 474
14.3.1 培训的开发 475
14.3.2 培训的传递 477
14.4 用户支持 478
14.5 台式计算机的准备和配置 479
14.6 小结 480
第15章 运行与维护 483
15.1 提供用户支持 484
15.1.1 BI门户的维护 485
15.1.2 BI应用程序的扩充 485
15.2 系统管理 486
15.2.1 ETL程序包的执行 486
15.2.2 商业智能系统的监控 489
15.2.3 磁盘空间的管理 498
15.2.4 查询的取消 500
15.2.5 服务和可用性的管理 501
15.2.6 DW/BI系统的性能调整 502
15.2.7 Analysis Services的性能调整 502
15.2.8 分区的管理 505
15.2.9 备份和恢复 510
15.3 小结 515
第Ⅴ部分 DW/BI系统的扩充 519
第16章 成长的管理 519
16.1 生命周期的迭代:成长的DW/BI系统 520
16.1.1 业务需求和项目管理 520
16.1.2 技术跟踪 520
16.1.3 数据的跟踪 521
16.1.4 应用程序的跟踪 521
16.1.5 部署、维护和成长 521
16.2 销售和期望的管理 522
16.2.1 利害关系人 522
16.2.2 定量的技术 523
16.2.3 定性的技术 524
16.3 系统互连 528
16.3.1 下游系统 528
16.3.2 主数据 528
16.3.3 BI Web服务 529
16.4 小结 530
第17章 实时商业智能 531
17.1 为(和不为)实时数据创建事例 532
17.1.1 让实时数据的传送变得困难的原因 532
17.1.2 什么让实时数据变得具有价值 533
17.1.3 您该做些什么 534
17.2 实时地执行报表 536
17.2.1 通过缓存向报表提供服务 536
17.2.2 从Integration Services程序包中获取报表 537
17.3 实时地加载DW/BI系统 539
17.3.1 集成的方法 539
17.3.2 实时层 540
17.4 使用Analysis Services来传送实时数据 543
17.4.1 从标准化的数据中构建多维数据集 543
17.4.2 主动缓存 544
17.4.3 通过Analysis Services实时地使用Integration Services 554
17.5 小结 555
第18章 目前的需要以及未来的展望 557
18.1 DW/BI项目中的很大风险 557
18.1.1 阶段Ⅰ——需求、现实、规划和设计 558
18.1.2 阶段Ⅱ——数据库和应用程序的开发 558
18.1.3 阶段Ⅲ——DW/BI系统的部署和管理 559
18.1.4 阶段Ⅳ——DW/BI系统的扩充 559
18.2 Microsoft BI工具集中受欢迎的部分 560
18.3 未来的方向:改进的空间 560
18.3.1 查询工具 561
18.3.2 元数据 561
18.3.3 关系数据库引擎 561
18.3.4 Analysis Services 562
18.3.5 分析应用程序 562
18.3.6 集成 562
18.4 小结 563