风险主题搜索引擎相关技术的研究与应用
| 摘要 | 第1-4页 |
| ABSTRACT | 第4-6页 |
| 目录 | 第6-8页 |
| 第一章 绪论 | 第8-13页 |
| ·引言 | 第8-9页 |
| ·主题搜索引擎的研究现状 | 第9-10页 |
| ·选题背景及研究意义 | 第10-11页 |
| ·本文的研究内容和论文结构 | 第11-13页 |
| 第二章 主题搜索的相关理论和关键技术 | 第13-21页 |
| ·主题爬虫的结构 | 第14-15页 |
| ·相关算法研究 | 第15-16页 |
| ·基于链接分析的搜索算法 | 第15-16页 |
| ·基于内容分析的搜索算法 | 第16页 |
| ·全文检索技术 | 第16-17页 |
| ·其他相关技术 | 第17-20页 |
| ·向量空间模型 | 第17-18页 |
| ·java多线程技术 | 第18-20页 |
| ·本章小结 | 第20-21页 |
| 第三章 风险主题爬虫的设计 | 第21-38页 |
| ·风险主题搜索策略 | 第21-32页 |
| ·搜索策略详细分析与对比 | 第21-30页 |
| ·改进的Shark-search | 第30-31页 |
| ·基于时间性能的PageRank算法改进 | 第31-32页 |
| ·基于综合搜索策略的爬行器设计 | 第32-36页 |
| ·主程序多线程设计 | 第36-37页 |
| ·本章小结 | 第37-38页 |
| 第四章 信息索引构建器的设计 | 第38-56页 |
| ·索引器简介 | 第38页 |
| ·中文全文检索索引器相关技术 | 第38-45页 |
| ·倒排索引技术 | 第39-41页 |
| ·基于单字的索引构造 | 第41-42页 |
| ·中文分词技术 | 第42-44页 |
| ·基于词表的索引构造 | 第44-45页 |
| ·基于改进倒排表索引的风险主题索引实现 | 第45-55页 |
| ·索引的结构与建立 | 第45-47页 |
| ·Nutch中的索引库实现 | 第47-55页 |
| ·本章小结 | 第55-56页 |
| 第五章 系统实验和性能分析 | 第56-62页 |
| ·Web实验 | 第56-60页 |
| ·实验原型系统介绍 | 第56-59页 |
| ·爬取能力实验 | 第59-60页 |
| ·搜索结果主题相关性实验 | 第60页 |
| ·数据结果分析 | 第60-61页 |
| ·本章小结 | 第61-62页 |
| 第六章 总结与展望 | 第62-63页 |
| ·本文工作总结 | 第62页 |
| ·未来工作展望 | 第62-63页 |
| 参考文献 | 第63-66页 |
| 致谢 | 第66-67页 |
| 硕士期间发表论文及参加项目 | 第67页 |