| 摘要 | 第1-6页 |
| Abstract | 第6-10页 |
| 第1章 绪论 | 第10-15页 |
| ·研究背景及意义 | 第10-11页 |
| ·中文自动分词的发展概况 | 第11-12页 |
| ·中文自动分词技术的发展前景 | 第12-13页 |
| ·本文的研究内容和组织结构 | 第13-15页 |
| ·研究内容 | 第13页 |
| ·组织结构 | 第13-15页 |
| 第2章 中文自动分词 | 第15-22页 |
| ·中文自动分词系统的框架 | 第15页 |
| ·中文自动分词算法 | 第15-20页 |
| ·基于字符串匹配的分词算法 | 第16-20页 |
| ·基于统计的分词方法 | 第20页 |
| ·基于理解的分词方法 | 第20页 |
| ·自动分词存在的难题 | 第20-22页 |
| ·通用词表和切分规范 | 第21页 |
| ·歧义切分问题 | 第21页 |
| ·未登录词识别 | 第21-22页 |
| 第3章 常用汉字编码规范简介 | 第22-25页 |
| ·G82312 | 第22页 |
| ·GBK | 第22-23页 |
| ·GBK2K | 第23页 |
| ·BIG5 | 第23-25页 |
| 第4章 基于FMM的自动分词优化算法 | 第25-38页 |
| ·正向最大匹配法分词算法(FMM)的缺陷 | 第25-26页 |
| ·长度限制 | 第25页 |
| ·效率低 | 第25页 |
| ·掩盖分词歧义 | 第25-26页 |
| ·基于FMM 的优化算法ImpFMMseg 的实现 | 第26-38页 |
| ·算法设计分析 | 第26页 |
| ·算法设计实现 | 第26-33页 |
| ·实验结果 | 第33-38页 |
| 总结与展望 | 第38-40页 |
| 参考文献 | 第40-43页 |
| 致谢 | 第43-44页 |
| 附录 A 攻读学位期间所发表的学术论文 | 第44页 |