首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Web短文本错误的诊断与修复研究

摘要第5-7页
Abstract第7-8页
第一章 绪论第12-18页
    1.1 课题研究背景与意义第12-13页
    1.2 国内外研究现状第13-15页
    1.3 存在的问题第15-16页
    1.4 本文的研究目标与工作第16页
    1.5 论文的结构第16-18页
第二章 研究基础第18-24页
    2.1 Web短文本的错误类型第18-19页
        2.1.1 语法结构错误第18-19页
        2.1.2 音相似形相似错误第19页
        2.1.3 语义错误第19页
    2.2 基于证据理论的信任函数第19-21页
        2.2.1 互信息与搭配聚合度第19-20页
        2.2.2 证据信任函数第20-21页
        2.2.3 属性的加权合成第21页
    2.3 基于词语搭配的算法第21-22页
    2.4 基于n-gram概率统计模型的算法第22-23页
    2.5 基于上下文语境的算法第23页
    2.6 本章小结第23-24页
第三章 问题定义与研究框架第24-27页
    3.1 问题定义第24页
        3.1.1 语法结构错误诊断与修复问题定义第24页
        3.1.2 音相似形相似错误诊断与修复问题定义第24页
    3.2 研究框架第24-27页
第四章 语法结构错误的诊断与修复第27-33页
    4.1 引言第27页
    4.2 词性二元组的构建第27-28页
    4.3 基于词性搭配的语法错误诊断第28-30页
        4.3.1 词性搭配规则集的构建第28-29页
        4.3.2 基于词性搭配的错误诊断实现第29-30页
    4.4 基于证据理论的语法错误诊断第30-31页
    4.5 利用词语知识搭配库的修复方法第31-32页
        4.5.1 词语知识搭配库的构建第31-32页
        4.5.2 语法结构错误的修复第32页
    4.6 本章小结第32-33页
第五章 音相似形相似错误的诊断与修复第33-42页
    5.1 引言第33页
    5.2 零散字词的聚类第33-34页
    5.3 利用三种算法进行得分计算第34-39页
        5.3.1 基于词性n-gram概率统计得分计算第34-36页
        5.3.2 上下文语境支持度得分计算第36页
        5.3.3 中文词性固定搭配得分计算第36-39页
    5.4 查错修复模型与算法定义第39-41页
    5.5 本章小结第41-42页
第六章 实验研究第42-51页
    6.1 数据获取与预处理第42页
    6.2 评价指标第42-43页
    6.3 针对语法结构错误的相关实验第43-46页
        6.3.1 数据预处理第43页
        6.3.2 语法结构错误的实验结果第43-46页
        6.3.3 实验分析第46页
    6.4 针对音相似形相似错误的相关实验第46-50页
        6.4.1 数据的获取预处理第46-48页
        6.4.2 音相似形相似错误修复结果第48-49页
        6.4.3 实验分析第49-50页
    6.5 本章小结第50-51页
第七章 总结与展望第51-53页
    7.1 总结第51-52页
    7.2 展望第52-53页
参考文献第53-56页
攻读硕士学位期间发表论文成果及参加的科研项目第56-57页
致谢第57页

论文共57页,点击 下载论文
上一篇:基于情感分析的个性化推荐算法研究
下一篇:基于电子信息技术的现代物流管理研究