面向社会媒体的中文文本校对方法研究与实现

中文摘要	第4-5页
Abstract	第5-6页
第1章绪论	第10-19页
1.1 研究目的和意义	第10-11页
1.2 英文文本校对的研究现状	第11-13页
1.3 中文社会媒体文本校对的研究现状	第13-16页
1.3.1 中文错别字校对的研究现状	第13-15页
1.3.2 中文谐音词语校对的研究现状	第15页
1.3.3 中文社会媒体文本校对研究存在的主要问题	第15-16页
1.4 本文主要研究内容	第16-17页
1.5 本文的组织安排	第17-19页
第2章社会媒体文本错误词语分析	第19-27页
2.1 引言	第19页
2.2 社会媒体文本特点	第19-20页
2.3 实验语料库	第20-22页
2.4 社会媒体文本中的错别字	第22-26页
2.4.1 音近错别字	第23-24页
2.4.2 形近错别字	第24-25页
2.4.3 谐音词	第25-26页
2.5 本章小结	第26-27页
第3章基于N-gram的汉语社会媒体文本校对	第27-46页
3.1 引言	第27-28页
3.2 基于N-gram的汉语文本校对总体框架	第28-29页
3.3 错别字正字候选构造	第29-34页
3.3.1 基于音素的错别字候选构建	第31-33页
3.3.2 基于形近字表的错别字候选构建	第33-34页
3.4 谐音校对候选构造	第34-35页
3.5 语言解码	第35-38页
3.5.1 n-gram语言模型	第35-36页
3.5.2 错别字/谐音词语解码	第36-38页
3.6 实验结果与分析	第38-45页
3.6.1 实验数据和评价指标	第38-39页
3.6.2 语言模型训练工具	第39-40页
3.6.3 错别字正字候选构造对校对性能的影响	第40-41页
3.6.4 基于N-gram的错别字校对实验结果	第41-43页
3.6.5 谐音词语还原实验结果	第43-45页
3.7 本章小结	第45-46页
第4章基于语义相似度的汉语文本校对	第46-64页
4.1 引言	第46-47页
4.2 基于语义相似度的文本校对任务描述	第47-48页
4.3 校对的词向量模型	第48-50页
4.3.1 词向量模型	第48-49页
4.3.2 候选的词向量表示	第49页
4.3.3 校对上下文的词向量表示	第49-50页
4.4 校对语义相似度计算	第50-52页
4.5 实验结果与分析	第52-63页
4.5.1 实验设置	第52页
4.5.2 系统参数	第52-56页
4.5.3 不同语义相似度计算方法对错别字校对性能的影响	第56-57页
4.5.4 不同词向量模型对错别字校对性能的影响	第57-61页
4.5.5 谐音词语校对实验	第61-62页
4.5.6 基于n-gram与基于语义相似度的文本校对方法对比	第62-63页
4.6 本章小结	第63-64页
结论	第64-66页
参考文献	第66-72页
致谢	第72-73页
攻读硕士学位期间发表的学术论文及参加的科研项目	第73页