图书介绍
数据索引与数据组织模型及其应用pdf电子书版本下载
- 胡运发著 著
- 出版社: 上海:复旦大学出版社
- ISBN:9787309086942
- 出版时间:2012
- 标注页数:204页
- 文件大小:56MB
- 文件页数:222页
- 主题词:索引组织
PDF下载
下载说明
数据索引与数据组织模型及其应用PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
上篇 3
第一章 第一后继字符有序的互关联后继树索引模型 3
1.1全文检索模型综述 3
1.1.1位图(Bitmap) 3
1.1.2署名文件(Signature Files) 4
1.1.3倒排表(Inverted Files) 5
1.1.4 Pat树和Pat数组 7
1.1.5∑2相邻矩阵模型 7
1.1.6全文索引模型的评价标准 8
1.2第一后继字符有序的互关联后继树 9
1.2.1基本定义 9
1.2.2后继区间概念介绍 11
1.2.3创建第一后继有序的互关联后继树创建算法 11
1.3后继区间查询算法 13
1.4后继区间查询算法复杂度及其性能分析 14
1.5实验与分析 15
1.6小结 16
第二章 双排序互关联后继树创建与查询算法 18
2.1引言 18
2.2双有序互关联后继树索引创建算法 19
2.3双排序互关联后继树查询算法 21
2.3.1逆向区间二分查询算法 21
2.3.2双排序互关联后继树二分验证查询算法 22
2.3.3双排序互关联后继树线性优化查询算法 23
2.4实验与分析 26
第三章 互关联后继树索引的编码优化方法 29
3.1引言 29
3.2编码方案 31
3.3位编码算法 32
3.4原文生成算法 34
3.4.1字符定位算法 34
3.4.2后继树编码计数算法 35
3.4.3后继树编码值算法 35
3.4.4原文根地址算法 36
3.4.5原文生成算法 37
3.5全文检索算法 38
3.6实验数据及分析 40
3.7小结 42
第四章 基于互关联后继树索引的文本压缩 43
4.1文本数据压缩的常用技术 43
4.1.1数据压缩 43
4.1.2文本压缩技术的分类 44
4.1.3几种主要的压缩模型 45
4.1.4文本压缩技术的应用 46
4.1.5压缩的评判标准 47
4.2后继树静态词典压缩 47
4.2.1互关联后继树静态词典的设计 47
4.2.2压缩和解压算法 49
4.2.3静态词典压缩算法改进 52
4.2.4性能比较与分析 54
4.3互关联后继树自适应词典压缩 58
4.3.1互关联后继树自适应词典的设计 58
4.3.2压缩和解压算法 59
4.3.3压缩算法改进 63
4.3.4互关联后继树自适应压缩算法特点 64
4.3.5性能比较与分析 64
4.3.6小结 66
第五章 基于后继模式树的XML索引模型 67
5.1引言 67
5.2基于后继模式树的倒向XML索引 68
5.3 XML的统一索引模型 70
5.3.1联合索引的创建 70
5.3.2 XML数据与全文数据的协同查询 74
5.4 XPath的自顶向下与自底向上查询 78
5.4.1绝对位置路径的查询树解析 78
5.4.2自顶向下查询 79
5.4.3自底向上查询 80
5.5基于后继模式树的协同查询 81
5.5.1后继模式树上的路径查询 82
5.5.2基于后继模式树的自底向上协同查询 83
5.6系统实现与实验 86
5.7小结 87
第六章 基于互关联后继模型的搜索引擎 88
6.1引言 88
6.1.1搜索引擎的原理 88
6.1.2主流搜索引擎介绍 89
6.1.3黄页搜索引擎基本需求 90
6.2基于互关联后继索引的搜索引擎 91
6.2.1搜索引擎与互关联后继树的结合 91
6.2.2互关联后继树搜索引擎的索引结构 91
6.3匹配度计算 95
6.3.1匹配度定义 95
6.3.2匹配度计算公式 95
6.3.3匹配度计算实现技术 96
6.3.4词位置号的保存 96
6.3.5匹配度计算 97
6.3.6实验与分析 98
6.4搜索结果排序技术 99
6.4.1通用排序算法介绍 99
6.4.2基于动态划分的多权值快速排序 103
6.4.3基于区间的划分算法 105
6.5小结 109
下篇 113
第七章 序列文本索引的粒子模型 113
7.1引言 113
7.2文本索引的粒子模型 114
7.2.1序列对象有序化 115
7.2.2有序化的序列对象粒子化 116
7.2.3有序化的序列对象粒子的结构关系 116
7.3互关联后继索引一文本序列商空间Istr1,2的性质 118
7.3.1商空间的熵的性质 119
7.3.2保假性与保序性 120
7.3.3 Istr1,2的特殊性质 121
7.4小结 122
第八章 创建索引模型的数学方法 124
8.1创建全文索引模型的数学变换 124
8.2互关联后继索引模型性能分析与比较 128
8.2.1倒排表和Pat数组的性能分析 129
8.2.2互关联后继索引模型性质 129
8.2.3分析与比较 131
8.3存储模型比较分析 132
8.3.1原文和索引都在内存 132
8.3.2原文在外存索引放置于内存的情况 133
8.3.3原文和索引都放置于外存的情况 134
8.4与Pat树等其他索引模型的关系 135
8.5小结 135
第九章 互关联后继索引模型的熵与压缩原理 136
9.1引言 136
9.2粒子细分的方法不能降低信息量 137
9.3公因子方法压缩原理 138
9.4差异熵压缩的原理 140
9.4.1一元编码 141
9.4.2 Golomb方法 141
9.4.3编码模式方法和实例 142
9.5小结 144
第十章 事务库的组织与数据挖掘 145
10.1 FP-Growth方法简介 145
10.2隐式互关联间接后继树/图的挖掘方法 147
10.2.1隐式互关联间接后继树(/图)表示 147
10.2.2 ISTR+树创建算法 148
10.2.3 Istr+树频繁项集挖掘算法 149
10.2.4 Istr+树挖掘算法与FP-growth算法的比较 150
10.3可变维数的隐式间接互关联后继树的挖掘方法 153
10.3.1可变维数的隐式间接互关联后继树表达 153
10.3.2 T-Istr+间接后继表的性质与频繁项的挖掘算法 155
10.3.3算法复杂性分析 158
10.4小结 158
第十一章 关系数据库与演绎数据库的数据组织 159
11.1协同查询问题的回顾 159
11.2关系的互关联后继的数据表达 161
11.3关系R-Istr+互关联隐式间接后继索引表与演算 164
11.3.1基于R-Istr+索引表的关系演算 164
11.3.2 R-Istr+查询操作的复杂性分析 166
11.4基于R-Istr+的关系库的协同查询 167
11.5演绎数据库的索引与演绎 169
11.5.1演绎数据库的索引 169
11.5.2基于I-Istr+的基本查询算法(集合查询算法) 171
11.5.3演绎数据库的演算 171
11.5.4对规则的演算 172
11.5.5复杂性的对比 173
11.6小结 174
第十二章 逻辑程序或知识库的索引 175
12.1逻辑程序的简单介绍[Hu88] 176
12.2严格有序的逻辑程序的索引模型 176
12.2.1第一种函词的序列表示 177
12.2.2创建逻辑子句索引的步骤 177
12.2.3互关联后继树索引与Warren抽象机数据的关系 178
12.2.4基于互关联后继索引的合一操作——索引合一 179
12.2.5推理步骤说明 180
12.2.6子句的或并行 181
12.2.7串行执行机制的改进——子目标级别优选 183
12.3逻辑程序并行性 184
12.3.1第二种函词表示方法 184
12.3.2创建互关联后继索引的步骤 185
12.3.3合一中的并行 185
12.3.4逻辑程序并行推理的实例 186
12.4结论 188
第十三章 基于互关联后继数据组织模型的文本信息隐藏技术 189
13.1引言 189
13.2相关技术与术语介绍 192
13.2.1术语介绍 192
13.2.2相关技术介绍 192
13.3基于互关联后继索引模型的文本信息隐藏方法 194
13.3.1信息隐藏过程 194
13.3.2信息提取过程 195
13.3.3控制功能 196
13.4安全强度分析 196
13.5小结 197
参考文献 198