基于统计的汉语自动分词系统

第一章绪论	第1-17页
·分词的发展历史	第8-11页
·基于字符串匹配的分词方法	第9页
·基于理解的分词方法	第9-10页
·基于统计的分词方法	第10页
·基于规则和基于统计相结合的方法	第10页
·基于语料库的统计分词方法	第10-11页
·分词系统的目标	第11-12页
·存在的问题	第12-15页
·本文所作的工作及研究目的	第15-17页
第二章基于语料库的统计分词理论	第17-22页
第三章分词系统的处理模式	第22-25页
第四章建立初始词典	第25-35页
·PAT 树的工作原理	第25-27页
·PAT 树的改进	第27-28页
·PAT 树的构造算法	第28-30页
·初始词典的建立	第30-35页
·初始词典的结构	第30-31页
·语料文本的处理	第31-32页
·初始词典的建立	第32-34页
·性能分析	第34-35页
第五章词典的建立	第35-45页
·初始词典的处理机制	第35-36页
·词典的组成	第36-37页
·初始词典的处理	第37-41页
·词典的处理	第41-45页
·词典收词的原则	第41-43页
·词典的处理	第43-45页
第六章语料分词及初始模型建立	第45-48页
·分词的规则	第45页
·分词的步骤	第45-46页
·分词的情况分析	第46-48页
第七章词典和模型的迭代优化	第48-49页
第八章实验与结果分析	第49-58页
·实验设计	第49页
·实验结果分析	第49-58页
·建立PAT 树和初始词典的性能分析	第49-52页
·初始词典的处理分析结果	第52-55页
·词典的处理结果	第55页
·分词情况分析	第55-56页
·词典和模型的迭代优化	第56-58页
第九章总结和展望	第58-60页
致谢	第60-61页
参考文献	第61-63页
攻读硕士期间的研究成果及发表的学术论文	第63页