首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Lucene的中文分词技术研究

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-13页
   ·研究背景及意义第7-8页
   ·研究现状第8-9页
   ·主要研究内容第9-10页
   ·论文总体结构第10-13页
第二章 LUCENE 剖析第13-21页
   ·LUCENE 概述第13-15页
     ·Lucene 项目简介第13-14页
     ·Lucene 系统结构第14-15页
   ·LUCENE 索引技术第15-17页
     ·倒排索引第15-16页
     ·索引结构第16-17页
     ·索引过程第17页
   ·LUCENE 检索技术第17-19页
     ·检索过程第17-18页
     ·与数据库检索比较第18-19页
   ·本章小结第19-21页
第三章 中文分词的核心技术第21-31页
   ·词典机制第21-22页
     ·整词二分词典第21页
     ·TRIE 索引树词典第21-22页
     ·逐字二分词典第22页
   ·中文分词算法第22-25页
     ·基于字符串匹配的分词算法第22-24页
     ·基于统计的分词算法第24-25页
     ·基于理解的分词算法第25页
   ·分词歧义第25-30页
     ·歧义类别第26-27页
     ·歧义采集方法第27-29页
     ·歧义消除方法第29-30页
   ·本章小结第30-31页
第四章 中文分词模块的设计第31-41页
   ·分词模块框架第31-32页
   ·词典机制设计第32-35页
   ·分词算法设计第35-37页
   ·分词歧义处理第37-40页
     ·互信息第37-38页
     ·歧义处理算法第38-40页
   ·本章小结第40-41页
第五章 中文分词模块的实现第41-51页
   ·MYCEANALYZER 分析器简介第41-42页
     ·分析器概述第41页
     ·MyCEAnalyzer 构造过程第41-42页
   ·词典机制实现第42-47页
     ·词典逻辑结构第42-43页
     ·词典初始化及更新第43-45页
     ·词典序列化第45页
     ·词典机制类图第45-47页
   ·分词机制实现第47-49页
     ·分词预处理第47-48页
     ·分词器类图第48-49页
   ·本章小结第49-51页
第六章 实验结果与性能测试第51-57页
   ·词典性能测试第51-53页
     ·空间开销第51-52页
     ·时间开销第52-53页
   ·分词性能测试第53-56页
     ·速度测试第53-54页
     ·精度测试第54-56页
   ·本章小结第56-57页
第七章 总结与展望第57-59页
   ·总结第57页
   ·展望第57-59页
致谢第59-61页
参考文献第61-64页

论文共64页,点击 下载论文
上一篇:基于语义的文本聚类算法研究
下一篇:极光形态及极光图像分类算法的研究