摘要 | 第1-9页 |
Abstract | 第9-11页 |
1 引言 | 第11-18页 |
·课题背景 | 第11-12页 |
·课题研究目的和意义 | 第12-13页 |
·垂直搜索引擎国内外研究现状 | 第13-16页 |
·垂直搜索引擎研究现状 | 第13-15页 |
·垂直搜索在农业领域中的研究动态 | 第15-16页 |
·本文主要研究内容和组织结构 | 第16-18页 |
2 主题搜索引擎系统结构设计 | 第18-27页 |
·搜索引擎发展 | 第18-20页 |
·搜索引擎分类 | 第18-19页 |
·搜索引擎技术发展史 | 第19-20页 |
·通用搜索引擎 | 第20-22页 |
·通用搜索引擎体系结构 | 第20-21页 |
·通用搜索引擎的局限性 | 第21-22页 |
·垂直搜索引擎 | 第22-24页 |
·垂直搜索引擎体系结构 | 第22-23页 |
·垂直搜索引擎的优势 | 第23-24页 |
·系统结构设计 | 第24-26页 |
·主题搜索引擎的系统结构设计 | 第24页 |
·系统关键技术 | 第24-26页 |
·本章小结 | 第26-27页 |
3 网页信息采集关键技术 | 第27-41页 |
·网络蜘蛛概述 | 第27-30页 |
·网络蜘蛛结构 | 第27-28页 |
·机器人协议 | 第28-29页 |
·开源网络蜘蛛 | 第29-30页 |
·主题网络蜘蛛模型 | 第30-33页 |
·主题网络蜘蛛的原理 | 第30-31页 |
·主题网络蜘蛛结构及工作流程 | 第31-33页 |
·网络蜘蛛搜索策略 | 第33-34页 |
·主题相关度分析算法 | 第34-39页 |
·基于内容的分析算法 | 第34-36页 |
·基于链接的分析算法 | 第36-39页 |
·改进的链接分析算法 | 第39-40页 |
·本章小结 | 第40-41页 |
4 索引相关技术 | 第41-53页 |
·中文分词技术 | 第41-43页 |
·基于字符串匹配的分词方法 | 第41-42页 |
·基于统计的分词方法 | 第42页 |
·基于理解的分词方法 | 第42-43页 |
·索引技术 | 第43-47页 |
·倒排索引 | 第43-45页 |
·索引构建方法 | 第45-47页 |
·Lucene 框架结构介绍 | 第47-49页 |
·基于 IKAnalyzer 分词的 Lucene 索引 | 第49-52页 |
·本章小结 | 第52-53页 |
5 大豆主题垂直搜索引擎的实现 | 第53-68页 |
·可行性研究及需求分析 | 第53-55页 |
·可行性研究 | 第53-54页 |
·需求分析 | 第54-55页 |
·数据库设计 | 第55-56页 |
·信息采集模块的设计与实现 | 第56-62页 |
·大豆主题网络蜘蛛结构设计 | 第56-58页 |
·URL 管理器实现 | 第58-59页 |
·网页下载器实现 | 第59-60页 |
·网页解析实现 | 第60-61页 |
·大豆主题相关度分析 | 第61-62页 |
·大豆主题索引实现 | 第62-63页 |
·管理与审核模块 | 第63-67页 |
·功能描述 | 第63-64页 |
·管理与审核模块实现 | 第64-67页 |
·本章小结 | 第67-68页 |
6 总结与展望 | 第68-69页 |
·全文总结 | 第68页 |
·研究展望 | 第68-69页 |
致谢 | 第69-70页 |
参考文献 | 第70-74页 |
攻读硕士学位期间发表的学术论文 | 第74页 |