个性化垂直搜索引擎研究
摘要 | 第1-5页 |
ABSTRACT | 第5-11页 |
第1章 绪论 | 第11-22页 |
·搜索引擎发展的历史过程 | 第11-15页 |
·为什么需要垂直搜索引擎? | 第15-19页 |
·垂直搜索引擎和综合搜索引擎在信息服务上的异同 | 第16-17页 |
·垂直搜索引擎和综合搜索引擎在关键技术上的异同 | 第17-19页 |
·国内外研究现状 | 第19-21页 |
·国外研究情况 | 第19-20页 |
·国内研究情况 | 第20-21页 |
·本文的研究工作 | 第21-22页 |
第2章 总体架构与信息采集 | 第22-31页 |
·垂直搜索引擎总体架构 | 第22-23页 |
·常用的信息采集策略 | 第23-25页 |
·个性化智能信息采集技术 | 第25-31页 |
·本体与本体知识库的构建 | 第25-28页 |
·基于本体知识库的智能化信息采集技术 | 第28-31页 |
第3章 LUCENE 框架的研究 | 第31-46页 |
·全文检索引擎 LUCENE 框架概述 | 第31-36页 |
·全文检索与全文检索系统 | 第31-32页 |
·Lucene 项目简介 | 第32-34页 |
·Lucene 框架构成 | 第34-36页 |
·文档索引 | 第36-39页 |
·倒排索引技术 | 第36页 |
·索引的建立 | 第36-39页 |
·搜索 | 第39-43页 |
·搜索的实现 | 第39-41页 |
·结果排序与文档评分机制 | 第41-43页 |
·中文分词 | 第43-46页 |
·常用的中文分词算法 | 第43-44页 |
·Lucene 分词的实现 | 第44-45页 |
·其他分词工具 | 第45-46页 |
第4章 垂直搜索引擎的实现 | 第46-64页 |
·项目总体系统设计 | 第46-47页 |
·信息采集子系统的设计与实现 | 第47-54页 |
·选用 Heritrix 框架的原因 | 第47-48页 |
·基于 Heritrix 框架的信息采集的实现 | 第48-51页 |
·信息整理的实现 | 第51-54页 |
·索引子系统的设计与实现 | 第54-58页 |
·中文分词分析器的设计 | 第54-56页 |
·基于 Lucene 框架的索引构建 | 第56-58页 |
·查询子系统的设计与实现 | 第58-64页 |
·MVC 模式 | 第58-59页 |
·基于 MVC 模式的查询子系统的设计与实现 | 第59-64页 |
第5章 总结与展望 | 第64-67页 |
致谢 | 第67-68页 |
参考文献 | 第68-70页 |
攻读硕士学位期间发表的论文及科研成果 | 第70页 |