自适应歧义切分的汉语分词系统的设计与实现
第一章 序言 | 第1-15页 |
1.1、论文背景 | 第10-12页 |
1.2、本文研究的意义 | 第12-13页 |
1.3、本文所做的工作 | 第13页 |
1.4、本文章节安排 | 第13-15页 |
第二章 汉语分词概述 | 第15-22页 |
2.1、汉语分词的概念 | 第15页 |
2.2、汉语分词的难点 | 第15-17页 |
2.2.1、分词规范问题 | 第15-16页 |
2.2.2、歧义切分 | 第16页 |
2.2.3、未登录词识别 | 第16-17页 |
2.2.4、分词理解的先与后 | 第17页 |
2.3、汉语分词现有方法介绍 | 第17-22页 |
2.3.1、基于字符串匹配的汉语分词方法 | 第17-19页 |
2.3.2、基于理解的汉语分词算法 | 第19页 |
2.3.3、基于统计的汉语分词算法 | 第19-21页 |
2.3.4、小结 | 第21-22页 |
第三章 一种快速汉语分词算法 | 第22-29页 |
3.1、引言 | 第22-23页 |
3.2、算法介绍 | 第23-24页 |
3.3、算法算法实现 | 第24-26页 |
3.3.1、索引的建立 | 第24-25页 |
3.3.2、信息记录 | 第25页 |
3.3.3、信息具体记录方法 | 第25-26页 |
3.3.4、算法具体实现 | 第26页 |
3.4、算法流程举例说明 | 第26-27页 |
3.5、算法评估 | 第27-28页 |
3.6、总结 | 第28-29页 |
第四章 改进型的N-最短路径粗分模型 | 第29-36页 |
4.1、N-最短路径粗分模型简介 | 第29-32页 |
4.2、对N-最短路径粗分模型的改进 | 第32-35页 |
4.3、总结 | 第35-36页 |
第五章 自适应歧义切分的汉语分词系统的设计与实现 | 第36-46页 |
5.1、引言 | 第36-37页 |
5.2、系统结构 | 第37-40页 |
5.2.1、系统结构图 | 第37页 |
5.2.2、分词词库的结构 | 第37-38页 |
5.2.3、二元信息库 | 第38-39页 |
5.2.4、四元信息库 | 第39-40页 |
5.3、分词预处理 | 第40-41页 |
5.4、选择最优解 | 第41页 |
5.5、自适应模型的建立 | 第41-43页 |
5.6、系统结果及分析 | 第43-45页 |
5.7、小结 | 第45-46页 |
第六章 系统的分析与评测 | 第46-60页 |
6.1、分词速度比较 | 第46-47页 |
6.2、分词精度比较 | 第47-58页 |
6.3、缺陷及不足 | 第58-60页 |
第七章 展望 | 第60-63页 |
7.1、未登录词的识别 | 第60页 |
7.2、语料信息的改变 | 第60-63页 |
参考文献 | 第63-67页 |
攻读学位期间公开发表的论文 | 第67-68页 |
致谢 | 第68页 |