基于树木搜索引擎的研究与实现
| 摘要 | 第3-4页 |
| ABSTRACT | 第4页 |
| 1 绪论 | 第7-14页 |
| 1.1 选题背景 | 第7-12页 |
| 1.1.1 搜索引擎的发展 | 第7-9页 |
| 1.1.2 搜索引擎的特点 | 第9-10页 |
| 1.1.3 搜索引擎的现状及面临的问题 | 第10-12页 |
| 1.2 研究的目的和意义 | 第12-13页 |
| 1.3 论文的内容和结构 | 第13-14页 |
| 2 搜索引擎原理 | 第14-25页 |
| 2.1 搜索引擎的基本结构 | 第14-19页 |
| 2.1.1 搜索引擎结构 | 第14-17页 |
| 2.1.2 搜索引擎的关键技术 | 第17-19页 |
| 2.2 网络爬虫介绍 | 第19-25页 |
| 2.2.1 开源网络爬虫 | 第20-21页 |
| 2.2.2 主题网络爬虫 | 第21-23页 |
| 2.2.3 主题相关性算法 | 第23-25页 |
| 3 分词模块的设计 | 第25-29页 |
| 3.1 分词技术概述 | 第25页 |
| 3.2 中文常用分词技术 | 第25-27页 |
| 3.2.1 基于词典的分词方法 | 第25-26页 |
| 3.2.2 基于统计的分词方法 | 第26-27页 |
| 3.2.3 基于理解的分词方法 | 第27页 |
| 3.3 本文所用分词技术 | 第27-29页 |
| 4 检索和查询模块的设计 | 第29-36页 |
| 4.1 常见索引介绍 | 第29-30页 |
| 4.2 Lucene系统结构 | 第30-34页 |
| 4.3 查询模型 | 第34-36页 |
| 5 树木检索系统的实现 | 第36-45页 |
| 5.1 树木索引的建立 | 第36-39页 |
| 5.2 查询的实现 | 第39-40页 |
| 5.3 搜索结果截图 | 第40-42页 |
| 5.4 系统评价 | 第42-45页 |
| 6 总结与展望 | 第45-47页 |
| 6.1 总结 | 第45页 |
| 6.2 展望 | 第45-47页 |
| 参考文献 | 第47-49页 |
| 个人简介 | 第49-50页 |
| 导师简介 | 第50-51页 |
| 获得成果目录 | 第51-52页 |
| 致谢 | 第52页 |