图书介绍

主题聚类及其应用研究pdf电子书版本下载

主题聚类及其应用研究
  • 章成志著 著
  • 出版社: 北京:国家图书馆出版社
  • ISBN:9787501349296
  • 出版时间:2013
  • 标注页数:178页
  • 文件大小:25MB
  • 文件页数:186页
  • 主题词:主题-情报检索-聚类分析;自然语言处理-自动标引

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快] 温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页 直链下载[便捷但速度慢]   [在线试读本书]   [在线获取解压码]

下载说明

主题聚类及其应用研究PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 引言 1

1.1研究背景 1

1.2研究意义 3

1.3主题聚类研究中存在的问题与解决方法 5

1.4本书内容安排 8

参考文献 9

第2章 主题聚类研究概述 11

2.1主题提取研究概述 11

2.2不同对象的聚类方法研究概述 18

参考文献 23

第3章 自动标引通用评价模型研究 27

3.1自动标引结果评价概述 27

3.2一种通用的自动标引评价模型 31

3.3自动标引评价模型的应用与性能分析 41

3.4本章小结 46

参考文献 47

第4章 基于机器学习的主题提取研究 49

4.1关键词类型分析 49

4.2几个对照的标引模型 53

4.3基于CRF的关键词提取方法 55

4.4基于集成学习的自动标引方法 76

4.5基于Citation-KNN的自动赋词标引方法 82

4.6本章小结 87

参考文献 87

第5章 主题聚类中聚类对象相似度计算研究 89

5.1基于多层特征的字符串相似度模型 89

5.2基于多语境的查询式相似度计算模型 95

5.3本章小结 102

参考文献 103

第6章 基于样本加权的文本聚类研究 105

6.1基于样本加权的文本聚类算法 105

6.2基于主题聚类的主题数字图书馆 116

6.3基于主题聚类的学科热点检测 119

64本章小结 121

参考文献 122

第7章 文本聚类结果描述算法研究 124

7.1文本聚类结果描述研究概述 124

7.2聚类描述要求、形式化及评价方法 128

7.3基于机器学习的聚类描述算法 133

7.4基于DCF-DCL组合策略的聚类描述算法 140

7.5基于主题的搜索结果聚类 144

7.6本章小结 147

参考文献 147

第8章 结束语 150

8.1总结 150

8.2进一步的研究工作 151

附录1 Segtag汉语文本词性标注标记集 153

附录2 SVMlight自动标引训练集样例 155

附录3 CRF ++自动标引训练集样例 157

附录4用于自动标引的CRF ++特征模板 159

附录5测试集自动标引结果样例 160

附录6相关词提取结果样例(整合后) 162

附录7文本的引用频次与Pagerank值样例(金融类) 164

附录8文本聚类后的类簇中心向量(煤炭类) 166

附录9主题数字图书馆聚类结果导航样例 168

附录10学科热点检测结果显示(图书情报档案类) 169

附录11 SVMlight聚类描述训练集样例 170

附录12基于主题的搜索结果聚类样例 172

索引 173

精品推荐