摘要 | 第1-5页 |
ABSTRACT | 第5-9页 |
第一章 绪论 | 第9-14页 |
·课题的研究背景及意义 | 第9-10页 |
·研究背景 | 第9-10页 |
·研究意义 | 第10页 |
·课题的研究现状 | 第10-12页 |
·国外研究现状 | 第10-11页 |
·国内研究现状 | 第11-12页 |
·课题的研究内容 | 第12页 |
·论文的组织结构 | 第12-14页 |
第二章 通用搜索与垂直搜索 | 第14-20页 |
·通用搜索引擎概述 | 第14-16页 |
·通用搜索引擎的产生与发展 | 第14-15页 |
·通用搜索引擎的结构与基本原理 | 第15-16页 |
·垂直搜索引擎概述 | 第16-18页 |
·垂直搜索引擎的产生与定义 | 第16-17页 |
·垂直搜索引擎的关键技术研究 | 第17-18页 |
·通用搜索引擎和垂直搜索引擎的比较 | 第18-19页 |
·本章小结 | 第19-20页 |
第三章 基于WatiJ的Deep Web蜘蛛设计与实现 | 第20-31页 |
·网络蜘蛛相关知识 | 第20-22页 |
·网络蜘蛛的体系结构 | 第20-21页 |
·网络蜘蛛的工作流程 | 第21页 |
·网络蜘蛛的抓取策略 | 第21-22页 |
·专家信息抓取问题分析与解决原理 | 第22-25页 |
·Deep Web问题 | 第23页 |
·Deep Web问题解决原理 | 第23-25页 |
·专家信息垂直搜索引擎专用蜘蛛的设计与实现 | 第25-30页 |
·专家信息网络蜘蛛体系结构 | 第25页 |
·蜘蛛实现 | 第25-30页 |
·抓取结果 | 第30页 |
·本章小结 | 第30-31页 |
第四章 基于Lucene的专家信息细胞词库中文分词 | 第31-45页 |
·全文检索工具Lucene的研究 | 第31-34页 |
·全文检索 | 第31-32页 |
·Lucene相关知识 | 第32-34页 |
·中文分词技术 | 第34-37页 |
·中文分词方法 | 第35-36页 |
·常用Lucene中文分词器对比 | 第36-37页 |
·专家信息细胞词库中文分词的设计与实现 | 第37-44页 |
·专家信息细胞词库的创立 | 第37-40页 |
·专家信息细胞词库的加载 | 第40-41页 |
·基于专家信息细胞词库的正向最大匹配算法 | 第41-42页 |
·基于Lucene的分词模块具体实现 | 第42-44页 |
·分词效果演示 | 第44页 |
·本章小结 | 第44-45页 |
第五章 专家信息垂直搜索引擎系统的设计与实现 | 第45-58页 |
·系统功能概述 | 第45-47页 |
·系统体系结构及开发环境 | 第47-48页 |
·系统处理流程 | 第48-49页 |
·基于S2SH的系统设计与实现 | 第49-54页 |
·S2SH框架介绍及整合 | 第49-50页 |
·系统用例分析 | 第50-51页 |
·典型用例实现 | 第51-54页 |
·系统实现效果 | 第54-57页 |
·本章小结 | 第57-58页 |
第六章 总结与展望 | 第58-60页 |
·工作总结 | 第58-59页 |
·下一步的研究 | 第59-60页 |
参考文献 | 第60-65页 |
致谢 | 第65-66页 |
攻读学位期间主要研究成果 | 第66页 |