首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Lucene的搜索引擎技术的研究与改进

摘要第1-5页
Abstract第5-6页
目录第6-8页
第一章 绪论第8-11页
   ·搜索引擎发展及分类第8-9页
   ·本论文的主要内容第9页
   ·论文的整体架构第9-11页
第二章 开源全文搜索引擎Lucene的详细分析第11-22页
   ·搜索引擎的核心和基本架构第11-12页
   ·LUCENE简介第12-13页
   ·Lucene包结构第13-14页
   ·Lueene核心原理第14-18页
     ·LUCENE各包的功能第15-16页
     ·LuCeoe核心类第16-18页
   ·Lueene的优点第18-19页
   ·Lucene倒排索引技术第19-20页
   ·搜索引擎的重要技术指标第20-22页
第三章 Lucene中文分词算法的改进第22-28页
   ·几种经典的分词算法分析第22-24页
     ·三种分词算法优劣比较第22-24页
   ·LUCENE分词原理第24-25页
   ·改进LUCENE中文分词方法第25-28页
第四章 Lucene检索结果排序算法的改进第28-31页
   ·LUCENE原检索结果排序算法介绍第28页
   ·对LUCENE检索结果排序算法改进第28-31页
     ·GOOGLE检索排序算法第28-29页
     ·检索关键词在页面中的位置第29-31页
第五章 多线程的信息抓取系统分析和设计第31-46页
   ·多线程的信息抓取系统的设计第31-33页
     ·多线程第31-32页
     ·线程同步第32-33页
   ·多线程信息抓取系统的关键技术第33-36页
     ·HTMLPARSER第33-36页
   ·信息抓取系统的搜索策略第36-37页
   ·资源池第37页
   ·多线程信息抓取系统结构和模块第37-38页
     ·资源解析模块的详细设计第37-38页
   ·改进的中文分词算法的实现第38-41页
     ·改进的中文分词算法的关键技术第38-41页
   ·改进的结果集排序算法第41页
   ·WEB搜索系统的实现第41-43页
   ·系统重点、难点第43-46页
     ·信息搜索系统对网页信息的提取第43-44页
     ·词表索引第44页
     ·线程管理第44-45页
     ·影响网页检索结果排序算法的因素和各因素权值的设定第45-46页
第六章 结束语第46-48页
致谢第48-49页
参考文献第49-50页

论文共50页,点击 下载论文
上一篇:基于ARM的车载交通流动态信息实时显示终端研究
下一篇:基于FPGA的USB接口协议及驱动技术研究