网商用户评论中错别字自动检测与纠正的研究及实现

摘要	第4-5页
Abstract	第5-6页
第1章绪论	第10-16页
1.1 研究背景及意义	第10-11页
1.1.1 研究背景	第10页
1.1.2 研究意义	第10-11页
1.2 国内外研究现状	第11-13页
1.2.1 国外研究现状	第11-12页
1.2.2 国内研究现状	第12-13页
1.3 课题来源	第13页
1.4 本文主要研究内容	第13-14页
1.5 本文结构安排	第14-16页
第2章相关技术介绍	第16-26页
2.1 统计语言模型	第16-19页
2.1.1 N-gram语言模型	第16-17页
2.1.2 数据平滑技术	第17-19页
2.2 传统检测和纠正算法	第19-21页
2.2.1 纠错字典算法	第19页
2.2.2 编辑距离算法	第19-21页
2.2.3 基于统计的检错算法	第21页
2.3 词向量	第21-25页
2.3.1 词向量概述	第21-22页
2.3.2 词向量训练	第22-23页
2.3.3 词向量训练工具	第23-25页
2.4 本章小结	第25-26页
第3章基于词向量的错别字自动检测算法	第26-36页
3.1 问题描述	第26-27页
3.1.1 网商用户评论中错别字产生原因	第26-27页
3.1.2 现有检测算法的不足	第27页
3.2 算法框架	第27-29页
3.3 关联度计算	第29-34页
3.3.1 初始关联度计算	第29-31页
3.3.2 基于词向量的关联度计算	第31-34页
3.4 概率统计	第34-35页
3.5 疑似评论筛选	第35页
3.6 本章小结	第35-36页
第4章基于权重机制的错别字自动纠正算法	第36-48页
4.1 问题描述	第36-39页
4.1.1 错别字类型	第36-38页
4.1.2 现有纠错算法的不足	第38-39页
4.2 算法框架	第39页
4.3 疑似词合并	第39-41页
4.4 候选词生成	第41-44页
4.4.1 字音相似度计算	第41-43页
4.4.2 字形相似度计算	第43-44页
4.4.3 候选词合并	第44页
4.5 最佳候选词生成	第44-47页
4.5.1 候选词排序	第44-45页
4.5.2 候选词替换	第45-47页
4.6 本章小结	第47-48页
第5章错别字自动检测与纠正的实现	第48-68页
5.1 错别字自动检测与纠正整体设计	第48-49页
5.2 数据预处理	第49-54页
5.2.1 水军评论过滤	第49-52页
5.2.2 数据替换	第52-53页
5.2.3 分词	第53-54页
5.3 语言模型的训练	第54-55页
5.4 基于词向量的错别字自动检测算法的实现	第55-60页
5.4.1 关联度计算	第55-56页
5.4.2 概率计算	第56页
5.4.3 错别字检测	第56-57页
5.4.4 结果分析	第57-60页
5.5 基于权重机制的错别字自动纠正算法的实现	第60-66页
5.5.1 候选词生成	第60-62页
5.5.2 错别字纠正	第62-63页
5.5.3 结果分析	第63-66页
5.6 本章小结	第66-68页
结论	第68-70页
参考文献	第70-74页
攻读硕士学位期间所获得的学术成果	第74-76页
致谢	第76页