基于Web短文本错误的诊断与修复研究
摘要 | 第5-7页 |
Abstract | 第7-8页 |
第一章 绪论 | 第12-18页 |
1.1 课题研究背景与意义 | 第12-13页 |
1.2 国内外研究现状 | 第13-15页 |
1.3 存在的问题 | 第15-16页 |
1.4 本文的研究目标与工作 | 第16页 |
1.5 论文的结构 | 第16-18页 |
第二章 研究基础 | 第18-24页 |
2.1 Web短文本的错误类型 | 第18-19页 |
2.1.1 语法结构错误 | 第18-19页 |
2.1.2 音相似形相似错误 | 第19页 |
2.1.3 语义错误 | 第19页 |
2.2 基于证据理论的信任函数 | 第19-21页 |
2.2.1 互信息与搭配聚合度 | 第19-20页 |
2.2.2 证据信任函数 | 第20-21页 |
2.2.3 属性的加权合成 | 第21页 |
2.3 基于词语搭配的算法 | 第21-22页 |
2.4 基于n-gram概率统计模型的算法 | 第22-23页 |
2.5 基于上下文语境的算法 | 第23页 |
2.6 本章小结 | 第23-24页 |
第三章 问题定义与研究框架 | 第24-27页 |
3.1 问题定义 | 第24页 |
3.1.1 语法结构错误诊断与修复问题定义 | 第24页 |
3.1.2 音相似形相似错误诊断与修复问题定义 | 第24页 |
3.2 研究框架 | 第24-27页 |
第四章 语法结构错误的诊断与修复 | 第27-33页 |
4.1 引言 | 第27页 |
4.2 词性二元组的构建 | 第27-28页 |
4.3 基于词性搭配的语法错误诊断 | 第28-30页 |
4.3.1 词性搭配规则集的构建 | 第28-29页 |
4.3.2 基于词性搭配的错误诊断实现 | 第29-30页 |
4.4 基于证据理论的语法错误诊断 | 第30-31页 |
4.5 利用词语知识搭配库的修复方法 | 第31-32页 |
4.5.1 词语知识搭配库的构建 | 第31-32页 |
4.5.2 语法结构错误的修复 | 第32页 |
4.6 本章小结 | 第32-33页 |
第五章 音相似形相似错误的诊断与修复 | 第33-42页 |
5.1 引言 | 第33页 |
5.2 零散字词的聚类 | 第33-34页 |
5.3 利用三种算法进行得分计算 | 第34-39页 |
5.3.1 基于词性n-gram概率统计得分计算 | 第34-36页 |
5.3.2 上下文语境支持度得分计算 | 第36页 |
5.3.3 中文词性固定搭配得分计算 | 第36-39页 |
5.4 查错修复模型与算法定义 | 第39-41页 |
5.5 本章小结 | 第41-42页 |
第六章 实验研究 | 第42-51页 |
6.1 数据获取与预处理 | 第42页 |
6.2 评价指标 | 第42-43页 |
6.3 针对语法结构错误的相关实验 | 第43-46页 |
6.3.1 数据预处理 | 第43页 |
6.3.2 语法结构错误的实验结果 | 第43-46页 |
6.3.3 实验分析 | 第46页 |
6.4 针对音相似形相似错误的相关实验 | 第46-50页 |
6.4.1 数据的获取预处理 | 第46-48页 |
6.4.2 音相似形相似错误修复结果 | 第48-49页 |
6.4.3 实验分析 | 第49-50页 |
6.5 本章小结 | 第50-51页 |
第七章 总结与展望 | 第51-53页 |
7.1 总结 | 第51-52页 |
7.2 展望 | 第52-53页 |
参考文献 | 第53-56页 |
攻读硕士学位期间发表论文成果及参加的科研项目 | 第56-57页 |
致谢 | 第57页 |