首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

网商用户评论中错别字自动检测与纠正的研究及实现

摘要第4-5页
Abstract第5-6页
第1章 绪论第10-16页
    1.1 研究背景及意义第10-11页
        1.1.1 研究背景第10页
        1.1.2 研究意义第10-11页
    1.2 国内外研究现状第11-13页
        1.2.1 国外研究现状第11-12页
        1.2.2 国内研究现状第12-13页
    1.3 课题来源第13页
    1.4 本文主要研究内容第13-14页
    1.5 本文结构安排第14-16页
第2章 相关技术介绍第16-26页
    2.1 统计语言模型第16-19页
        2.1.1 N-gram语言模型第16-17页
        2.1.2 数据平滑技术第17-19页
    2.2 传统检测和纠正算法第19-21页
        2.2.1 纠错字典算法第19页
        2.2.2 编辑距离算法第19-21页
        2.2.3 基于统计的检错算法第21页
    2.3 词向量第21-25页
        2.3.1 词向量概述第21-22页
        2.3.2 词向量训练第22-23页
        2.3.3 词向量训练工具第23-25页
    2.4 本章小结第25-26页
第3章 基于词向量的错别字自动检测算法第26-36页
    3.1 问题描述第26-27页
        3.1.1 网商用户评论中错别字产生原因第26-27页
        3.1.2 现有检测算法的不足第27页
    3.2 算法框架第27-29页
    3.3 关联度计算第29-34页
        3.3.1 初始关联度计算第29-31页
        3.3.2 基于词向量的关联度计算第31-34页
    3.4 概率统计第34-35页
    3.5 疑似评论筛选第35页
    3.6 本章小结第35-36页
第4章 基于权重机制的错别字自动纠正算法第36-48页
    4.1 问题描述第36-39页
        4.1.1 错别字类型第36-38页
        4.1.2 现有纠错算法的不足第38-39页
    4.2 算法框架第39页
    4.3 疑似词合并第39-41页
    4.4 候选词生成第41-44页
        4.4.1 字音相似度计算第41-43页
        4.4.2 字形相似度计算第43-44页
        4.4.3 候选词合并第44页
    4.5 最佳候选词生成第44-47页
        4.5.1 候选词排序第44-45页
        4.5.2 候选词替换第45-47页
    4.6 本章小结第47-48页
第5章 错别字自动检测与纠正的实现第48-68页
    5.1 错别字自动检测与纠正整体设计第48-49页
    5.2 数据预处理第49-54页
        5.2.1 水军评论过滤第49-52页
        5.2.2 数据替换第52-53页
        5.2.3 分词第53-54页
    5.3 语言模型的训练第54-55页
    5.4 基于词向量的错别字自动检测算法的实现第55-60页
        5.4.1 关联度计算第55-56页
        5.4.2 概率计算第56页
        5.4.3 错别字检测第56-57页
        5.4.4 结果分析第57-60页
    5.5 基于权重机制的错别字自动纠正算法的实现第60-66页
        5.5.1 候选词生成第60-62页
        5.5.2 错别字纠正第62-63页
        5.5.3 结果分析第63-66页
    5.6 本章小结第66-68页
结论第68-70页
参考文献第70-74页
攻读硕士学位期间所获得的学术成果第74-76页
致谢第76页

论文共76页,点击 下载论文
上一篇:中美可口可乐视频广告的多模态话语对比分析
下一篇:预设理论视角下《阿甘正传》的言语幽默分析