基于条件随机场的中文分词研究与应用
摘要 | 第1-5页 |
Abstract | 第5-9页 |
第1章 绪论 | 第9-14页 |
·自然语言处理概述 | 第9-11页 |
·国内研究现状 | 第11-12页 |
·本文工作 | 第12-13页 |
·论文组织结构 | 第13-14页 |
第2章 汉语自动分词 | 第14-28页 |
·汉语自动分词研究的意义 | 第14-16页 |
·汉语自动分词的研究方法 | 第16-22页 |
·基于规则的分词方法 | 第16-21页 |
·基于统计的分词方法 | 第21-22页 |
·汉语分词面临的问题 | 第22-28页 |
·汉语词的概念尚待解决 | 第23页 |
·汉语分词的规范问题 | 第23-24页 |
·不同的服务目的 | 第24页 |
·字段切分歧义问题 | 第24-26页 |
·未登录词问题 | 第26-28页 |
第3章 条件随机场模型 | 第28-44页 |
·序列标记 | 第29页 |
·隐马尔可夫模型 | 第29-33页 |
·隐马尔可夫模型原理 | 第29-31页 |
·隐马尔可夫模型原理在序列标记中的应用 | 第31-33页 |
·最大熵模型 | 第33-36页 |
·最大熵原理 | 第33-35页 |
·最大熵模型在序列标记中的应用 | 第35-36页 |
·条件随机场模型 | 第36-44页 |
·生成模型 | 第36-37页 |
·判别模型 | 第37-38页 |
·条件随机场理论 | 第38-40页 |
·条件随机场模型的优点 | 第40-43页 |
·条件随机场模型的不足 | 第43-44页 |
第4章 基于条件随机场的分词方法 | 第44-53页 |
·基于条件随机场的汉字标注分词 | 第44-45页 |
·标注方法 | 第44-45页 |
·特征选取 | 第45页 |
·CRF分词系统 | 第45-50页 |
·分词系统流程 | 第46-47页 |
·特征选取 | 第47-50页 |
·分词实验 | 第50-52页 |
·实验语料的选择 | 第50页 |
·实验测评标准 | 第50-51页 |
·CFR分词系统性能测试实验 | 第51-52页 |
·CFR分词系统与其它模型的比较 | 第52页 |
·本章小结 | 第52-53页 |
第5章 基于CRF模型中文分词的文本自动校对 | 第53-63页 |
·文本自动校对 | 第53页 |
·应用CRF模型中文分词的文本自动校对 | 第53-61页 |
·文本常见错误类型 | 第54页 |
·文本自动校对 | 第54-60页 |
·CRF文本自动校对的对比实验 | 第60-61页 |
·中文文本自动校对算法的发展前景 | 第61-63页 |
第6章 总结与展望 | 第63-65页 |
·本文总结 | 第63-64页 |
·展望 | 第64-65页 |
参考文献 | 第65-68页 |
致谢 | 第68-69页 |
攻读硕士学位期间主要成绩 | 第69页 |