首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene的垂直搜索引擎关键技术的研究应用

摘要第1-5页
Abstract第5-8页
第1章 绪论第8-18页
   ·本课题的研究背景第8页
   ·通用搜索引擎第8-13页
     ·通用搜索引擎的发展史第8-10页
     ·通用搜索引擎的分类和工作流程第10-11页
     ·通用搜索引擎的局限性和发展趋势第11-13页
   ·垂直搜索引擎第13-16页
     ·垂直搜索引擎的系统结构第13-15页
     ·垂直搜索引擎的优势第15-16页
     ·垂直搜索引擎发展现状第16页
   ·本文的主要工作及创新第16-17页
   ·论文的结构第17-18页
第2章 垂直搜索引擎的关键技术第18-38页
   ·中文分词第18-24页
     ·基于字符串匹配的分词方法第19-22页
     ·基于统计的分词方法第22-24页
     ·基于理解的分词方法第24页
     ·三种分词方法的比较第24页
   ·主题相关度预测第24-28页
     ·PageRank算法的原理第25页
     ·PageRank算法的缺陷及改进第25-26页
     ·基于概率的改进PageRank算法设计第26-28页
   ·主题爬虫第28-37页
     ·网络爬虫的基本原理与结构第28-30页
     ·主题爬行策略第30-31页
     ·主题爬虫新策略的核心思想第31-33页
     ·主题爬虫新策略的实现方案第33-36页
     ·试验第36-37页
   ·本章小结第37-38页
第3章 检索框架Lucene的分析研究第38-48页
   ·Lucene的框架分析第38-44页
     ·Lucene的应用特点的分析研究第38-40页
     ·Lucene的系统结构组织的剖析第40-41页
     ·Lucene数据流的分析第41-42页
     ·Lucene索引文件格式分析第42-44页
   ·对Lucene框架的总结说明第44-47页
   ·本章小结第47-48页
第4章 垂直搜索引擎原型系统的设计和实现第48-60页
   ·系统总体设计第48-49页
   ·信息采集子系统的设计与实现第49-54页
     ·选用Heritrix框架的原因第49页
     ·基于Heritrix框架的信息采集的实现第49-50页
     ·信息整理的实现第50-54页
   ·索引子系统的设计与实现第54-56页
     ·中文分词分析器的设计第54页
     ·基于Lucene框架的索引构建第54-56页
   ·查询子系统的设计与实现第56-59页
     ·MVC模式第56-57页
     ·基于MVC模式的查询子系统的设计与实现第57-58页
     ·系统的实现第58-59页
   ·本章小结第59-60页
第5章 总结与展望第60-62页
参考文献第62-66页
致谢第66-67页
攻读硕士学位期间发表的论文情况第67页

论文共67页,点击 下载论文
上一篇:移动智能客户端技术在协同工作中的应用
下一篇:带QoS需求的安全的多数据库访问中间件技术的研究