首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Lucene的中文分词技术研究与实现

摘要第1-4页
ABSTRACT第4-8页
第1章 绪论第8-15页
   ·中文分词第8页
   ·中文分词的研究背景第8-9页
   ·中文分词的研究现状及意义第9-11页
     ·中文分词的处理方法第9-10页
     ·中文分词中的难题第10-11页
   ·中文分词的研究现状及意义第11-12页
   ·中文分词应用的当前主流搜索引擎简介第12-14页
   ·本文主要工作和思路第14-15页
第2章 Lucene分析与设计第15-34页
   ·Lucene简介第15页
   ·Lucene的主要功能及特点第15-16页
   ·Lucene包结构第16-17页
   ·Lucene的系统结构图第17-19页
   ·Lucene的索引结构第19-26页
     ·Lucene的索引分析第19-23页
     ·使用Lucene进行索引的核心算法第23-24页
     ·使用Lucene实现检索的核心算法第24-25页
     ·Lucene索引文件格式第25页
     ·倒排索引原理第25-26页
   ·Lucene的分析器第26-30页
     ·Lucene自带的中文分词算法第26-27页
     ·改进的中文分词算法第27-30页
   ·实验结果第30-33页
     ·准备工作第30页
     ·运行环境第30-33页
     ·结果比较第33页
   ·本章小结第33-34页
第3章 中文分词模块的设计第34-50页
   ·MyChAnalyzer的构造过程第34-36页
   ·分词词典的构造与维护第36-39页
   ·分词算法详述第39-43页
     ·变量说明第39页
     ·算法主要核心思想第39-40页
     ·算法实现第40-43页
   ·实验结果第43-49页
     ·分词器速度测试第43-44页
     ·精度测试第44-48页
     ·分词系统比较第48-49页
   ·本章小结第49-50页
第4章 Lucene的结果排序算法改进第50-58页
   ·以页面内容为基础的算法第50-51页
   ·PageRank算法的提出第51-52页
   ·PageRank基本原理第52-54页
   ·Direct Hit算法第54-55页
   ·Lucene排序结果的改进算法第55-56页
   ·算法分析第56-58页
第5章 总结与展望第58-59页
   ·总结第58页
   ·展望第58-59页
参考文献第59-62页
附录A:中文分词程序第62-66页
本文作者硕士期间的科研成果第66-67页
致谢第67-68页

论文共68页,点击 下载论文
上一篇:基于小波变换的多聚焦图像融合算法的创新研究
下一篇:非真实成像的水墨画绘制模型若干技术研究