采用机器学习方法实现泰语分词
摘要 | 第3-4页 |
Abstract | 第4-5页 |
第一章 绪论 | 第8-14页 |
1.1 泰语语音合成以及泰语分词研究现状 | 第8-9页 |
1.2 泰语分词方法概述 | 第9-12页 |
1.3 研究思路与作者的工作 | 第12-13页 |
1.4 论文结构 | 第13-14页 |
第二章 用机器学习方法实现泰语分词的原理 | 第14-27页 |
2.1 背景知识介绍 | 第14-16页 |
2.1.1 泰语简介 | 第14页 |
2.1.2 机器学习算法简介 | 第14-16页 |
2.2 三种常用的机器学习算法 | 第16-20页 |
2.2.1 朴素贝叶斯算法 | 第16-17页 |
2.2.2 决策树算法 | 第17-19页 |
2.2.3 支持向量机算法 | 第19-20页 |
2.3 条件随机场模型 | 第20-26页 |
2.3.1 隐马尔科夫模型 | 第20-22页 |
2.3.2 最大熵隐马尔科夫模型 | 第22-23页 |
2.3.3 标记偏置问题 | 第23-24页 |
2.3.4 条件随机场模型结构 | 第24-26页 |
2.4 本章小结 | 第26-27页 |
第三章 泰语分词的实现 | 第27-38页 |
3.1 泰语语料库与实验平台 | 第27-29页 |
3.2 利用三种常用分类器实现泰语分词 | 第29-33页 |
3.2.1 泰语字符的特征项 | 第30-31页 |
3.2.2 泰语字符的位置关系 | 第31页 |
3.2.3 模型训练的过程 | 第31-33页 |
3.3 采用条件随机场模型实现泰语分词 | 第33-37页 |
3.3.1 泰语字符的特征项 | 第33-34页 |
3.3.2 泰语字符的位置关系 | 第34页 |
3.3.3 模型训练的过程 | 第34-37页 |
3.4 采用二元字符标记实现泰语分词 | 第37-38页 |
第四章 实验结果与分析 | 第38-41页 |
4.1 实验结果 | 第38-39页 |
4.2 分析 | 第39-41页 |
第五章 总结与展望 | 第41-43页 |
5.1 总结 | 第41页 |
5.2 展望 | 第41-43页 |
参考文献 | 第43-46页 |
致谢 | 第46-47页 |