摘要 | 第1-5页 |
Abstract | 第5-7页 |
1 绪论 | 第7-12页 |
·研究中文分词的目的和意义 | 第7-8页 |
·中文分词的发展过程和发展现状 | 第8-11页 |
·主要的研究内容以及论文内容安排 | 第11-12页 |
2 中文分词技术 | 第12-17页 |
·中文分词的定义 | 第12页 |
·中文分词的规范和评测标准 | 第12-14页 |
·中文分词的难点 | 第14-17页 |
3 统计语言模型 | 第17-25页 |
·最大熵模型 | 第17-21页 |
·HMM 模型(Hidden Markov Model) | 第21-23页 |
·N-gram 模型 | 第23-25页 |
4 基于统计的分词算法 | 第25-42页 |
·基于层次隐马模型的分词 | 第25-36页 |
·基于字位信息的分词 | 第36-39页 |
·基于拼音标注的分词算法 | 第39-42页 |
5 实验数据和分析 | 第42-45页 |
6 结束语 | 第45-46页 |
致谢 | 第46-47页 |
参考文献 | 第47-50页 |