| 摘要 | 第1-4页 |
| ABSTRACT | 第4-8页 |
| 1 引言 | 第8-16页 |
| ·汉语自动分词技术研究的意义 | 第8-9页 |
| ·汉语书面语自动分词系统研究现状 | 第9-13页 |
| ·几个早期的自动分词系统 | 第10页 |
| ·SEG分词系统和SEGTAG系统 | 第10-11页 |
| ·复旦分词系统 | 第11页 |
| ·哈尔滨工业大学统计分词系统 | 第11页 |
| ·Microsoft Research汉语句法分析器中的自动分词 | 第11-12页 |
| ·北大计算语言所分词系统 | 第12页 |
| ·罗海清的"生成性隐性小词表"汉语自动分词系统 | 第12-13页 |
| ·主要的自动分词算法 | 第13-16页 |
| ·基于字符串匹配的分词方法 | 第13-14页 |
| ·基于理解的分词方法 | 第14-15页 |
| ·基于统计的分词方法 | 第15-16页 |
| ·研究方法和资料来源 | 第16页 |
| 2 "生成性隐性小词表"分词系统 | 第16-31页 |
| ·"生成性隐性小词表"概述 | 第16-24页 |
| ·"生成性隐性小词表"的基本原理 | 第17-18页 |
| ·分词程序 | 第18-19页 |
| ·基本算法 | 第19-24页 |
| ·"生成性隐性小词表"的优势和局限 | 第24-30页 |
| ·"生成性隐性小词表"分词系统的优势 | 第24-30页 |
| ·"生成性隐性小词表"分词系统需要完善的问题 | 第30页 |
| ·改进的方面和潜力 | 第30-31页 |
| 3 文本的预处理和专业小词库 | 第31-41页 |
| ·预处理的原理及其模式 | 第31-33页 |
| ·预处理的原理 | 第31-32页 |
| ·"预处理+专业小词库"的分词模式 | 第32-33页 |
| ·专业小词库的具体示例 | 第33-40页 |
| ·样本选择及语料库的建设 | 第33-35页 |
| ·分词处理 | 第35-36页 |
| ·词频统计 | 第36-38页 |
| ·专业小词库 | 第38-40页 |
| ·"隐性小词表+专业小词库"的分词模式 | 第40-41页 |
| 4 总结 | 第41-42页 |
| 5 附录 | 第42-60页 |
| 参考文献 | 第60-63页 |
| 攻读硕士期间科研及发表的学术论文 | 第63-64页 |
| 致谢 | 第64-67页 |