面向现代汉语文本处理的全文检索、自动分词通用系统

中文摘要	第1-6页
ABSTRACT	第6-7页
第一章前言	第7-11页
·研究背景及现状	第7-9页
·全文检索的概念与特点	第7-8页
·中文全文检索	第8-9页
·本文的工作和意义	第9-10页
·本文的主要内容及其组织	第10-11页
第二章全文检索引擎Lucene的分析研究	第11-22页
·Lucene简介	第11页
·Lucene的倒排索引原理	第11-13页
·Lucene的组成结构	第13-16页
·LUCENE的基本数据类型	第16页
·Lucene中的文件格式	第16-21页
·全文检索的实现机制	第21-22页
第三章全文检索系统的分析与设计	第22-28页
·系统的整体结构	第22-23页
·模块的功能描述	第23-25页
·文档对象	第23页
·语言分析器和查询分析器	第23-24页
·检索接口	第24页
·索引接口	第24-25页
·系统数据流逻辑	第25-26页
·数据流分析	第26-27页
·系统的可扩展性	第27-28页
第四章中文自动分词技术	第28-71页
·自动分词技术及发展概况	第28-34页
·汉语自动分词技术及存在的困难	第28-31页
·汉语自动分词的研究现状及分析	第31-34页
·分词算法	第34-42页
·现有的的分词算法分析	第34-40页
·本系统所用分词算法	第40-42页
·分词词典	第42-45页
·词典的常用组织结构	第42-43页
·本系统的分词词典机制	第43-44页
·本系统词典的结构	第44-45页
·歧义字段的处理	第45-49页
·歧义字段产生的根源及其处理策略	第46-47页
·本系统中歧义字段的消解方法	第47-49页
·未登录词识别	第49-58页
·未登录词的研究现状	第50-52页
·未登录词现有解决方案的讨论	第52-53页
·本系统中未登录词的解决方案	第53-54页
·数字串的识别	第54-56页
·重叠词形式的识别	第56-58页
·词性标注	第58-66页
·词性标注的研究的概况	第58-59页
·常用的兼类词排歧方法及存在问题分析	第59-64页
·本系统的处理方式	第64-66页
·自动分词系统的设计与实现	第66-71页
·系统设计原则及思路	第66-67页
·系统结构研制流程图	第67-70页
·系统的实现及其性能测评	第70-71页
第五章系统集成的设计与实现	第71-79页
·检索结果的打开与保存	第71-72页
·建立检索	第72-74页
·检索流程	第74页
·查询表达式的处理	第74-75页
·检索结果的输出	第75-77页
·自动分词模块	第77-78页
·字频、词频统计	第78-79页
第六章结论	第79-82页
·本文工作总结	第79页
·检索功能的比较与测试	第79-81页
·今后的工作	第81-82页
参考文献	第82-85页
后记	第85页