首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene的搜索引擎优化

致谢第1-6页
中文摘要第6-7页
ABSTRACT第7-10页
1 引言第10-18页
   ·课题背景介绍第10-11页
   ·国内外相关技术调研第11-14页
     ·搜索引擎发展及分类第12-13页
     ·全文检索系统介绍第13页
     ·中文分词简介第13-14页
   ·项目中遇到的问题以及解决方法第14-16页
     ·对Lucene的中分分词模块的重构第14页
     ·建立分词词典第14-15页
     ·分词算法设计第15页
     ·搜索结果集排序算法的设计与改进工作第15-16页
   ·本课题的研究意义第16-17页
   ·论文结构第17-18页
2 全文检索引擎Lucene的分析与研究第18-25页
   ·Lucene简介第18页
   ·Lucene的主要功能与特点第18-20页
     ·Lucene的主要功能第18-19页
     ·Lucene的特点第19-20页
   ·Lucene的包结构第20-21页
   ·Lucene全文检索引擎框架分析第21-25页
     ·Lucene系统结构分析第21-22页
     ·Lucene数据流分析第22-23页
     ·Lucene索引机制分析第23-25页
3 Lucene中文分词模块的重构第25-39页
   ·构造中文分析器第25-27页
   ·分词字典的构造与维护第27-31页
   ·中文分词算法介绍第31页
     ·分词规范及分词原则第31页
   ·中文分词的重要难点第31-32页
     ·歧义识别第31-32页
     ·新词识别第32页
   ·Lucene中文分词算法改进第32-36页
     ·算法思想第32-33页
     ·中文分词算法实现第33-36页
   ·中文分词算法实验结果分析第36-39页
4 Lucene检索结果排序算法的改进第39-48页
   ·词频位置加权排序算法介绍第39-40页
   ·Direct Hit算法介绍第40页
   ·PageRank算法介绍第40-41页
   ·PageRank算法分析第41-43页
   ·PageRank算法的缺陷第43-45页
     ·PageRank偏重旧网页第43页
     ·判断网页的权值时,忽视了站点的权威性第43-44页
     ·从网页中指出的超链接,对网页PR值影响不相同第44-45页
   ·Lucene排序算法改进第45页
   ·Lucene排序算法实验结果分析第45-48页
5 总结第48-49页
参考文献第49-50页
附录A第50-53页
附录B第53-56页
附录C第56-61页
学位论文数据集第61页

论文共61页,点击 下载论文
上一篇:强震条件下层状岩体斜坡动力失稳机理研究
下一篇:我国煤炭业循环经济产业链的构建研究