首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

Lucene与中文分词技术的研究及应用

致谢第1-6页
中文摘要第6-7页
ABSTRACT第7-11页
1 绪论第11-15页
   ·引言第11-12页
     ·研究的背景及意义第11页
     ·搜索引擎研究的现状第11-12页
   ·相关技术概述第12-14页
     ·Lucene概述第12-13页
     ·Struts2概述第13-14页
   ·主要工作及论文结构第14页
     ·主要工作第14页
     ·论文结构第14页
   ·本章小结第14-15页
2 Lucene的全面分析第15-29页
   ·Lucene的结构分析第15-18页
     ·Lucene的总体架构第15-16页
     ·Lucene的包结构第16-18页
   ·Lucene的索引技术第18-25页
     ·索引操作的类结构第18-19页
     ·索引的组织结构第19-20页
     ·索引的数据结构第20-21页
     ·索引的建立模式第21-22页
     ·索引的优化方法第22-24页
     ·索引的存储方式第24-25页
   ·Lucene的检索技术第25-28页
     ·Lucene的检索类结构第25-26页
     ·Lucene的检索语法第26-27页
     ·Lucene的检索过程第27-28页
   ·本章小结第28-29页
3 中文分词的相关分析第29-34页
   ·中文分词的研究现状第29页
   ·中文分词算法的比较和分析第29-33页
     ·基于字符串匹配的分词方法第29-31页
     ·基于理解的分词方法第31-32页
     ·基于统计的分词方法第32-33页
     ·基于语义的分词方法第33页
   ·本章小结第33-34页
4 全文搜索引擎实现分析与设计第34-39页
   ·全文搜索引擎系统的需求分析第34-35页
   ·全文搜索引擎系统的设计第35-38页
     ·系统设计目标第35页
     ·系统总体设计第35-37页
     ·系统模块设计第37-38页
   ·本章小结第38-39页
5 全文搜索引擎的实现第39-55页
   ·信息采集模块的实现第39-41页
     ·信息采集模块的总体结构第39-40页
     ·网页抓取模块的实现第40页
     ·网页分析模块的实现第40-41页
   ·文档解析模块的实现第41-46页
     ·文档解析模块的详细设计第41-42页
     ·PDF文件格式的解析第42-43页
     ·OFFICE文件格式的解析第43-45页
     ·HTML文件格式的解析第45-46页
   ·中文分词模块的实现第46-47页
   ·索引模块的实现第47-50页
     ·索引的建立第47-48页
     ·索引的删除第48-49页
     ·索引的优化处理第49-50页
   ·搜索模块的实现第50-53页
     ·搜索的建立第50-52页
     ·搜索结果的排序第52-53页
     ·搜索的优化处理第53页
   ·用户模块的实现第53-54页
   ·本章小结第54-55页
6 中文分词性能分析第55-60页
   ·测试环境和测评标准第55-57页
     ·测试环境第55页
     ·测试数据第55-56页
     ·测评标准第56-57页
   ·测试结果以及结果分析第57-59页
     ·测试结果第57-58页
     ·结果分析第58-59页
   ·本章小结第59-60页
7 结论第60-61页
参考文献第61-63页
作者简历第63-65页
学位论文数据集第65页

论文共65页,点击 下载论文
上一篇:分类器性能评价研究
下一篇:车牌识别系统关键技术的研究与实现