图书介绍
智能搜索 大数据搜索引擎原理及算法解析pdf电子书版本下载
- 沙芸编著 著
- 出版社: 北京:清华大学出版社
- ISBN:9787302535508
- 出版时间:2019
- 标注页数:199页
- 文件大小:87MB
- 文件页数:208页
- 主题词:搜索引擎-程序设计
PDF下载
下载说明
智能搜索 大数据搜索引擎原理及算法解析PDF格式电子书版下载
下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如 BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!
(文件页数 要大于 标注页数,上中下等多册电子书除外)
注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具
图书目录
第1章 智能搜索引擎开发 1
1.1 人工智能与智能搜索引擎 1
1.2 Linux操作系统基础 2
1.2.1 SSH远程登录 2
1.2.2 Micro文本编辑器 4
1.2.3 Linux Shell脚本基础 4
1.2.4 Shell脚本 5
1.2.5 AWK 8
1.3 Java基础 8
1.3.1 使用Ant 9
1.3.2 使用Maven 11
1.3.3 使用Gradle 13
1.3.4 使用Groovy Shell 16
1.3.5 使用JShell 17
1.4 Python基础 17
1.4.1 Windows下安装Python 17
1.4.2 Linux下安装Python 17
1.4.3 开发环境 18
1.5 C#基础 19
1.6 硬件基础 21
1.7 本章小结 22
第2章 搜索引擎理解语义 23
2.1 处理文本 23
2.2 基于文法的语言模型 24
2.3 正则表达式查找文本 25
2.4 中文词语切分与词性标注 27
2.4.1 使用中文分词 28
2.4.2 正向最大长度匹配法 30
2.4.3 未登录串识别 31
2.4.4 基本的N元模型 34
2.5 隐马尔可夫模型 43
2.5.1 数据基础 43
2.5.2 维特比算法 44
2.6 英文文本切分与标注 48
2.6.1 句子切分 48
2.6.2 标注词性 50
2.7 命名实体识别 52
2.7.1 人名识别 52
2.7.2 人名识别规则 53
2.8 文本归一化 61
2.9 依存树模型 62
2.10 情感分析 63
2.11 本章小结 66
第3章 搜索引擎听懂语音 67
3.1 语音识别总体结构 67
3.2 Kaldi快速入门 68
3.2.1 安装Kaldi 69
3.2.2 yesno例子 69
3.2.3 数据准备 70
3.2.4 词典准备 71
3.2.5 构建一个简单的ASR 74
3.3 使用FFmpeg提取音频 82
3.4 时间序列 82
3.5 动态时间规整 84
3.6 傅里叶变换 86
3.6.1 离散傅里叶变换 86
3.6.2 快速傅里叶变换 89
3.7 MFCC特征 92
3.8 在线解码 93
3.8.1 使用现成的模型 93
3.8.2 使用Alex-ASR 94
3.9 加权有限状态转换 95
3.9.1 FSA 96
3.9.2 FST 97
3.9.3 WFST 98
3.10 语音识别语料库 99
3.10.1 TIMIT语音库 99
3.10.2 中文语音库 99
3.11 本章小结 100
第4章 Elasticsearch分布式搜索引擎 101
4.1 搭建Elasticsearch集群 101
4.2 索引数据 103
4.3 实现搜索接口 107
4.4 搜索界面开发 108
4.4.1 使用Spring Boot开发搜索界面 109
4.4.2 使用.NET开发搜索界面 132
4.5 检索模型 142
4.5.1 使用BM25检索模型 146
4.5.2 参数调优 146
4.6 搜索中文优化 147
4.7 Elasticsearch源代码分析 152
4.7.1 导入源代码到Eclipse 152
4.7.2 Guice框架 152
4.7.3 Netty异步IO框架 154
4.7.4 分布式设计与实现 155
4.7.5 使用Lucene 156
4.8 本章小结 159
第5章 分布式计算平台 160
5.1 Atomix框架 160
5.1.1 Raft协议 160
5.1.2 使用Atomix 162
5.2 gRPC框架 164
5.3 本章小结 167
第6章 智能搜索案例分析 168
6.1 医药垂直搜索引擎 168
6.1.1 网络爬虫 169
6.1.2 抓取PubMed 177
6.1.3 MVC搜索界面开发 179
6.1.4 构建知识库 183
6.1.5 自动问答 185
6.2 电商搜索 188
6.2.1 电商爬虫 188
6.2.2 商品搜索 192
6.2.3 在线客服 195
6.3 本章小结 198
参考文献 199