图书介绍
数据仓库生命周期工具箱——设计、开发和部署数据仓库的专家方法pdf电子书版本下载
- (美)金博尔(Kimball,R.)等著 肖明等译 著
- 出版社: 电子工业出版社
- ISBN:
- 出版时间:2004
- 标注页数:699页
- 文件大小:74MB
- 文件页数:733页
- 主题词:
PDF下载
下载说明
数据仓库生命周期工具箱——设计、开发和部署数据仓库的专家方法PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
目录 1
第1章 数据仓库的基本组成 1
1.1 数据仓库的基本组成要素 1
1.2 数据仓库基本过程 10
1.3 有关数据仓库的大讨论 13
1.3.1 数据仓库建模 14
1.3.2 数据集市与数据仓库 14
1.3.3 分布式与集中式数据仓库 15
小结 16
2.1 生命周期演化 19
第2章 业务维生命周期 19
第一部分 项目管理与需求 19
2.2 生命周期方法 20
2.2.1 项目规划 21
2.2.2 业务需求定义 21
2.2.3 数据轨迹:维度建模 22
2.2.4 数据轨迹:物理设计 22
2.2.5 数据轨迹:数据登台设计与开发 22
2.2.6 技术轨迹:技术结构设计 23
2.2.7 技术轨迹:产品选择与安装 23
2.2.8 应用轨迹:最终用户应用规范 23
2.2.10 部署 24
2.2.11 维护与增长 24
2.2.9 应用轨迹:最终用户应用开发 24
2.2.12 项目管理 25
2.3 业务维生命周期使用指南 25
2.4 业务维生命周期指示标记与浏览帮助 26
小结 27
第3章 项目规划与管理 28
3.1 项目定义 29
3.1.1 建设数据仓库应做的准备工作 30
3.1.2 “最后检验”准备是否就绪 32
3.1.3 评价影响准备就绪的因素 34
3.1.4 分析准备状态是否不足的方法 35
3.1.5 确定初步范围 39
3.1.6 构造业务的合理性证明 43
3.2 项目规划 48
3.2.1 建立项目标识 48
3.2.2 组建项目组 49
3.2.3 制定项目计划 57
3.3 项目管理 61
3.3.1 举行项目小组启动会议 62
3.3.2 监控项目状态 63
3.3.3 维护项目计划和项目文档 66
3.3.4 管理项目范围 67
3.3.5 制定有关管理期望的交流计划 70
小结 74
第4章 收集项目需求 78
4.1 定义项目需求的各种方法 79
4.2 访谈准备 81
4.3 准备合适的访谈者 91
4.4 进行访谈 94
4.5 开始访谈 96
4.6 结束访谈 104
4.7 对访谈结果进行审查 107
4.8 准备和发布项目需求规范文档 109
4.9 项目需求收集完成后的工作 112
小结 114
第5章 维度建模的第1课 121
第二部分 数据设计 121
5.1 维度建模案例 122
5.1.1 什么是实体-关系建模 122
5.1.2 什么是维度建模 125
5.1 3维度建模与实体-关系建模之间的关系 127
5.1.4 维度建模的优点 128
5.2 利用数据仓库总线结构将各种维度模型组合起来 133
5.2.1 规划危机 134
5.2.2 带总线结构的数据集市 135
5.2.3 一致性维度和标准事实的定义 136
5.2.4 一致性维度的设计 138
5.2.5 确保采用一致性维度 138
5.2.6 建立一致性事实定义 139
5.2.7 数据集市粒度的重要性 140
5.2.8 多元数据集市 141
5.2.9 拯救不兼容性数据集市 142
5.2.10 何时不需要一致性维度 142
5.2.11 数据仓库总线 143
5.3 基本维度建模技术 144
5.3.1 事实表与维度表 144
5.3.2 向上和向下探查维度表内情 146
5.3.3 建议使用的时间维度 153
5.3.4 加法性事实、半加法性事实以及非加法性事实 169
5.3.5 设计单个事实表的4步设计方法 170
小结 190
第6章 维度建模的研究生课程 191
6.1 扩充维度表的设计 192
6.1.1 多对多维度 192
6.1.2 多对一与一对多陷阱 195
6.1 3维度的不同角色扮演 196
6.1.4 组织与其下级部门的层次表示 199
6.1.5 不可预知的层次深度 203
6.1.6 大型维度中的时间戳变化 205
6.1.7 创建审计维度 209
6.1.8 维度数是太少了还是太多了 209
6.2 扩充事实表的设计 211
6.2.1 具有不同粒度的事实及其分配 211
6.2.2 以天为单位的维度表 215
6.2.3 多种指标单位 217
6.2.4 跨国货币情况跟踪 219
6.2.5 数值分组报告 221
6.3 高级ROLAP查询和报告 222
6.3.1 采用多种技术探查的查询 222
6.3.3 市场份额分析 229
小结 231
第7章 多维模型的创建 233
7.1 开始阶段使用的矩阵方法 234
7.1.1 矩阵的创建 234
7.1.2 必要的准备 235
7.1.3 列出数据集市 236
7.1.4 列出各种维度 237
7.1.5 标记交叉点 238
7.2 用4步法设计各个事实表 240
7.3 管理维度建模项目 243
7.3.1 数据仓库总线结构矩阵 244
7.3.2 事实表图表 244
7.3.3 事实表明细图 246
7.3.4 维度表明细图 247
7.3.5 维度建模小组的创建步骤 250
7.3.6 创建初始草图 251
7.3.7 跟踪基本事实和派生事实 252
7.3.9 与核心业务用户一起工作 257
7.3.8 让信息系统小组进行输入 257
7.3.10 向业务用户进行介绍 258
7.4 管理建模过程中存在的问题 259
7.4.1 为每个事实表和维度表确定来源 260
7.4.2 候选数据源 261
7.4.3 源数据所有权 263
7.4.4 数据提供者 263
7.4.5 选择数据源的详细准则 263
7.4.6 客户匹配与内部成员匹配 266
7.4.7 浏览数据内容 266
7.4.8 将源数据映射到目标数据 268
7.4.9 什么时候才算完成 270
7.4.10 为未来做准备 271
7.4.11 使用数据建模工具 272
7.4.12 估计行数 272
7.4.13 聚集设计 273
7.4.14 确定聚集的内容 274
小结 275
第三部分 数据仓库结构 281
第8章 数据仓库结构介绍 281
8.1 结构的价值 282
8.2 一个结构框架和方法 284
8.2.1 定义列 285
8.2.2 定义细节级别(行) 287
8.2.3 逻辑模型与物理模型 289
8.2.4 框架小结 289
8.3 技术结构概述 290
8.3.1 服务和数据存储 291
8.3.2 从源系统到用户桌面的流程 291
8.3.3 主要技术结构特性 293
8.3.4 数据仓库结构评估 295
小结 296
第9章 后台技术结构 297
9.1 后台数据存储 298
9.1.1 源系统 298
9.1.2 数据登台区 305
9.1.3 呈现服务器 306
9.2 后台服务 310
9.2.1 普通数据登台要求 311
9.2.2 创建与购买 316
9.2.3 提取服务 317
9.2.4 数据转换服务 320
9.2.5 数据装载服务 323
9.2.6 数据登台作业控制服务 323
9.3 后台资产管理 326
9.3.1 备份与恢复 326
9.3.2 存档与检索 327
9.3.3 备份与存档规划 328
9.3.4 提取和装载安全性问题 329
9.3.5 未来登台服务 329
小结 331
第10章 前台结构 332
10.1 前台数据存储 334
10.1.1 存取工具数据存储 334
10.1.2 标准报告数据存储 334
10.1.3 下行系统 336
10.2 用于数据存取的前台服务 337
10.2.1 数据仓库浏览 337
10.2.2 存取与安全性服务 338
10.2.3 活动监控服务 339
10.2.4 查询管理服务 340
10.2.5 查询服务位置 343
10.2.6 标准报告服务 344
10.2.7 未来存取服务 345
10.2.8 桌面服务 346
10.2.9 建模应用和数据挖掘 356
10.2.1 0数据存取的Web含义 359
10.2.1 1桌面工具结构方法 360
小结 363
第11章 体系结构与元数据 365
11.1 体系结构 366
11.1.1 体系结构的驱动力 366
11.1.2 体系结构的演变 367
11.1.3 后台体系结构因素 368
11.1.4 前台体系结构因素 381
11.1.5 连通性与联网因素 383
11.1.6 体系结构小结 386
11.2 元数据与元数据目录 386
11.2.1 什么是元数据 387
11.2.2 源系统元数据 388
11.2.3 数据登台元数据 389
11.2.4 数据库管理系统元数据 390
11.2.5 前台元数据 391
11.2.6 活动元数据样例 392
11.2.7 元数据目录的维护 396
11.2.8 元数据小结 398
小结 399
第12章 有关互联网和安全性方面的研究生课程 400
12.1 组件软件结构 402
12.1.1 互联网对结构的影响 405
12.2 安全性的脆弱 407
12.2.1 物理资产 409
12.2.2 信息资产:数据、财务资产以及声誉 411
12.2.3 软件资产 417
12.2.4 执行业务任务的能力 418
12.2.5 网络威胁 419
12.3 安全性:解决方案 422
12.3.1 路由器与防火墙 423
12.3.2 目录服务器 428
12.3.3 加密技术 429
12.4 数据仓库环境下的安全性管理 441
12.5 在安全性方面应采取的措施 442
12.5.1 立即执行的战术性措施 442
12.5.2 战略性措施 444
小结 444
第13章 创建结构计划与产品选择 447
13.1 创建结构 448
13.1.1 结构创建过程 449
13.1.2 创建技术结构计划 450
13.2 选择产品 460
13.2.1 集中关注业务需求 460
13.2.2 主要数据仓库评估区域 460
13.2.3 评估过程 461
13.2.4 创建产品评估矩阵 462
13.2.5 进行市场研究 465
13.2.6 将选择缩减到一份简短清单上 465
13.2.7 评估选项 466
13.2.8 选择开发一个原型 467
13.2.9 产品推荐 473
13.2.10 评估捷径 473
13.2.11 后台评估 475
13.2.12 前台评估 477
13.3 安装 480
小结 480
第四部分 数据仓库实施 489
第14章 有关聚集的研究生课程 489
14.1 聚集的目标和风险 490
14.2 确定要聚集的内容 491
14.3 制定聚集表计划 492
14.4 对聚集进行处理 495
14.5 对聚集进行管理 497
14.6 聚集浏览系统的设计目标 501
14.7 聚集浏览算法 505
14.7.1 与规划数据相交 509
14.7.2 有关MIN,MAX,COUNT,AVG的处理 509
14.7.3 适用于所有人的聚集 510
小结 511
第15章 完成物理设计 512
15.1 制定标准 514
15.1.1 数据库对象命名标准 514
15.1.2 为用户存取的所有表使用同义词 517
15.1.3 物理文件位置 517
15.2 创建物理数据模型 518
15.2.2 数据建模工具的使用 520
15.2.1 饮料商店销售额案例研究 520
15.2.3 物理数据结构的设计 522
15.2.4 估计最初的开发规模 529
15.3 制定最初的索引计划 533
15.3.1 索引和查询策略概述 533
15.3.2 为事实表创建索引 537
15.3.3 为维度表创建索引 538
15.3.4 为装载创建索引 538
15.3.5 在装载完成后对表和索引进行分析 539
15.3.6 索引案例研究 539
15.4.1 内存 542
15.4.2 块大小 542
15.4 设计和创建数据库实例 542
15.4.3 磁盘存取样例 543
15.4.4 保存数据库创建脚本和参数文件 544
15.5 创建物理存储结构 545
15.5.1 计算表和索引的大小 545
15.5.2 制定分割计划 546
15.5.3 建立RAID 547
15.6 实施使用监控系统 549
15.6.1 性能 549
15.6.2 用户支持 550
15.6.3 市场营销 550
15.6.4 规划 551
15.6.5 工具 551
小结 552
第16章 数据登台 556
16.1 数据登台概述 557
16.2 做一些预备工作 558
16.2.1 良好系统开发实践的重要性 558
16.3 进行有效的计划 558
16.3.1 步骤1:高级计划 559
16.3.2 步骤2:数据登台工具 560
16.3.3 步骤3:详细计划 561
16.4 维度表登台 563
16.4.1 步骤4:装载一个简单的维度表 564
16.4.2 静态维度表的转换 565
16.4.3 步骤5:实施维度变化逻辑 570
16.4.4 步骤6:装载剩余维度表 573
16.5 事实表装载与数据仓库操作 576
16.5.1 步骤7:装载原子级历史事实 576
16.5.2 步骤8:增量式事实表登台 585
16.5.3 步骤9:聚集表和多维联机分析处理装载 591
16.5.4 步骤10:数据仓库的操作与自动化 594
16.6 数据质量与净化 597
16.6.1 数据质量改进 598
16.6.2 数据质量保证 602
16.7 其他问题 603
16.73 磁盘空间管理问题 604
16.7.2 源系统中的回退段问题 604
16.7.1 数据登台区中的存档问题 604
小结 605
第17章 创建最终用户应用 609
17.1 最终用户应用角色 610
17.1.1 最终用户应用模板 611
17.1.2 生命周期的时间选择 613
17.2 应用规范 614
17.2.1 确定最初的模板集合 614
17.2.2 设计模板浏览方法 618
17.2.3 确定模板标准 619
17.2.4 详细模板规范 620
17.2.5 用户审查 621
17.3 最终用户应用开发 622
17.3.1 选择一种实现方法 622
17.3.2 应用开发 623
17.3.3 测试与数据验证 625
17.3.4 文档及其展示 626
17.3.5 像软件开发管理人员那样思考问题 627
17.3.6 应用模板维护 628
小结 628
第五部分 数据仓库的部署与增长 635
第18章 规划部署 635
18.1 确定是否已经准备好桌面安装 636
18.2.1 集成和裁剪培训内容 637
18.2 制定最终用户培训策略 637
18.2.2 开展最终用户培训 640
18.2.3 实施最终用户培训 641
18.3 制定最终用户支持策略 643
18.3.1 确定对组织结构的支持 644
18.3.2 参与数据协调方面的支持 645
18.3.3 参与最终用户应用支持 646
18.3.4 建立交流与反馈支持 646
18.3.5 提供支持文档 647
18.4 研制部署发布框架 649
18.4.1 A1pha版本发布 649
18.4.2 Beta版本发布 650
18.4.3 产品发布(又名部署) 651
18.5 编制有关部署策略的文档 654
小结 654
第19章 数据仓库的维护与增长 657
19.1 对现有数据仓库环境的管理 658
19.1.1 关注业务用户 659
19.1.2 管理数据仓库操作 662
19.1.3 数据仓库的成功测度和市场营销 664
19.1.4 经常进行交流 666
19.2 为数据仓库的增长与演变做准备 667
19.2.1 建立数据仓库指导委员会 668
19.2.2 优化数据仓库增长与演变的机会 670
19.2.3 采用生命周期方法管理数据仓库的迭代增长与演变 671
小结 673
附录A 生命周期项目计划 677
附录B 关于本书附带的CD-ROM 693
B.1项目计划 693
B.2数据仓库总线结构样例 693
B.3模板、检查清单、图形和帮助 694
第2章 业务维生命周期 695
第3章 项目规划与管理 695
第4章 项目需求的收集 696
第7章 多维模型的创建 696
第8章 数据仓库结构介绍 696
第12章 有关互联网和安全性的研究生课程 697
第13章 结构计划的创建与产品的选择 697
第9章 后台技术结构 697
第11章 体系结构与元数据 697
第10章 前台结构 697
第15章 完成物理设计 698
第16章 数据登台 698
第17章 创建最终用户应用 698
第18章 规划部署 699
B.4 CD-ROM的使用 699
B.5 CD-ROM浏览器的用法说明 699
B.6 软件要求 699