摘要 | 第1-6页 |
Abstract | 第6-10页 |
第1章 绪论 | 第10-15页 |
·研究背景及意义 | 第10-11页 |
·中文自动分词的发展概况 | 第11-12页 |
·中文自动分词技术的发展前景 | 第12-13页 |
·本文的研究内容和组织结构 | 第13-15页 |
·研究内容 | 第13页 |
·组织结构 | 第13-15页 |
第2章 中文自动分词 | 第15-22页 |
·中文自动分词系统的框架 | 第15页 |
·中文自动分词算法 | 第15-20页 |
·基于字符串匹配的分词算法 | 第16-20页 |
·基于统计的分词方法 | 第20页 |
·基于理解的分词方法 | 第20页 |
·自动分词存在的难题 | 第20-22页 |
·通用词表和切分规范 | 第21页 |
·歧义切分问题 | 第21页 |
·未登录词识别 | 第21-22页 |
第3章 常用汉字编码规范简介 | 第22-25页 |
·G82312 | 第22页 |
·GBK | 第22-23页 |
·GBK2K | 第23页 |
·BIG5 | 第23-25页 |
第4章 基于FMM的自动分词优化算法 | 第25-38页 |
·正向最大匹配法分词算法(FMM)的缺陷 | 第25-26页 |
·长度限制 | 第25页 |
·效率低 | 第25页 |
·掩盖分词歧义 | 第25-26页 |
·基于FMM 的优化算法ImpFMMseg 的实现 | 第26-38页 |
·算法设计分析 | 第26页 |
·算法设计实现 | 第26-33页 |
·实验结果 | 第33-38页 |
总结与展望 | 第38-40页 |
参考文献 | 第40-43页 |
致谢 | 第43-44页 |
附录 A 攻读学位期间所发表的学术论文 | 第44页 |