垂直搜索引擎的研究与设计
摘要 | 第1-5页 |
Abstract | 第5-9页 |
第1章 绪论 | 第9-12页 |
·课题研究背景 | 第9-10页 |
·本文主要工作 | 第10页 |
·论文章节安排 | 第10-12页 |
第2章 通用搜索引擎 | 第12-21页 |
·搜索引擎的分类及其局限性 | 第12-14页 |
·搜索引擎的分类 | 第12-13页 |
·通用搜索引擎的局限性 | 第13-14页 |
·搜索引擎发展的现状及未来 | 第14-15页 |
·搜索引擎的工作原理 | 第15-16页 |
·相关技术介绍 | 第16-18页 |
·网页信息抓取技术 | 第16-17页 |
·网页内容分析技术 | 第17页 |
·网页索引建立技术 | 第17-18页 |
·用户检索与结果排序 | 第18页 |
·网页检索工具与接口 | 第18页 |
·搜索引擎的评价指标体系 | 第18-20页 |
·本章小结 | 第20-21页 |
第3章 垂直搜索引擎 | 第21-31页 |
·垂直搜索引擎概述 | 第21-25页 |
·垂直搜索引擎的产生及体系结构 | 第21-23页 |
·垂直搜索引擎的生存之道 | 第23-24页 |
·垂直搜索引擎的盈利模式 | 第24-25页 |
·相关技术简介 | 第25-30页 |
·专业网络爬虫 | 第25-27页 |
·网页预处理 | 第27-28页 |
·中文分词 | 第28-30页 |
·本章小结 | 第30-31页 |
第4章 专业爬虫的分析与设计 | 第31-45页 |
·专业爬虫的设计思想 | 第31页 |
·主题判别的研究现状 | 第31-34页 |
·布尔模型 | 第32页 |
·向量空间模型(VSM) | 第32-34页 |
·专业爬虫的搜索策略 | 第34-40页 |
·基于网页内容分析的搜索策略 | 第34-37页 |
·基于超链分析的搜索策略 | 第37-40页 |
·改进的搜索策略 | 第40-43页 |
·网页内容相关度的确定 | 第41页 |
·基于链接结构分析的相关度的确定 | 第41-42页 |
·对PageRank算法的改进 | 第42-43页 |
·基于网页内容和链接结构分析相结合的搜索策略 | 第43页 |
·本章小结 | 第43-45页 |
第5章 Web信息索引器的分析与设计 | 第45-53页 |
·索引器的基本结构 | 第45-46页 |
·倒排索引技术 | 第46-49页 |
·Lucene中索引的建立 | 第49-52页 |
·本章小结 | 第52-53页 |
第6章 试验测试及性能分析 | 第53-59页 |
·VSE-Spider系统的特点 | 第53页 |
·VSE-Spider系统的实现 | 第53-55页 |
·试验及结果分析 | 第55-58页 |
·本章小结 | 第58-59页 |
第7章 总结与展望 | 第59-61页 |
·全文总结 | 第59页 |
·研究展望 | 第59-61页 |
参考文献 | 第61-64页 |
致谢 | 第64-65页 |
附录:攻读硕士学位期间发表的学术论文 | 第65页 |