基于统计的汉语自动分词系统
第一章 绪论 | 第1-17页 |
·分词的发展历史 | 第8-11页 |
·基于字符串匹配的分词方法 | 第9页 |
·基于理解的分词方法 | 第9-10页 |
·基于统计的分词方法 | 第10页 |
·基于规则和基于统计相结合的方法 | 第10页 |
·基于语料库的统计分词方法 | 第10-11页 |
·分词系统的目标 | 第11-12页 |
·存在的问题 | 第12-15页 |
·本文所作的工作及研究目的 | 第15-17页 |
第二章 基于语料库的统计分词理论 | 第17-22页 |
第三章 分词系统的处理模式 | 第22-25页 |
第四章 建立初始词典 | 第25-35页 |
·PAT 树的工作原理 | 第25-27页 |
·PAT 树的改进 | 第27-28页 |
·PAT 树的构造算法 | 第28-30页 |
·初始词典的建立 | 第30-35页 |
·初始词典的结构 | 第30-31页 |
·语料文本的处理 | 第31-32页 |
·初始词典的建立 | 第32-34页 |
·性能分析 | 第34-35页 |
第五章 词典的建立 | 第35-45页 |
·初始词典的处理机制 | 第35-36页 |
·词典的组成 | 第36-37页 |
·初始词典的处理 | 第37-41页 |
·词典的处理 | 第41-45页 |
·词典收词的原则 | 第41-43页 |
·词典的处理 | 第43-45页 |
第六章 语料分词及初始模型建立 | 第45-48页 |
·分词的规则 | 第45页 |
·分词的步骤 | 第45-46页 |
·分词的情况分析 | 第46-48页 |
第七章 词典和模型的迭代优化 | 第48-49页 |
第八章 实验与结果分析 | 第49-58页 |
·实验设计 | 第49页 |
·实验结果分析 | 第49-58页 |
·建立PAT 树和初始词典的性能分析 | 第49-52页 |
·初始词典的处理分析结果 | 第52-55页 |
·词典的处理结果 | 第55页 |
·分词情况分析 | 第55-56页 |
·词典和模型的迭代优化 | 第56-58页 |
第九章 总结和展望 | 第58-60页 |
致谢 | 第60-61页 |
参考文献 | 第61-63页 |
攻读硕士期间的研究成果及发表的学术论文 | 第63页 |