首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文词法错误自动检测关键技术研究

摘要第1-9页
Abstract第9-10页
第一章 绪论第10-24页
   ·课题背景第10-11页
   ·英文文本错误自动检测技术现状第11-13页
     ·非词错误的检测技术第11-12页
     ·真词错误的检测技术第12-13页
   ·中文文本错误自动检测技术现状第13-21页
     ·自动检查错的研究第14-18页
     ·自动纠错的研究第18-19页
     ·技术难点和应用定位第19-21页
   ·论文研究内容和结构第21-24页
     ·文本错误检测的一般流程第21-22页
     ·本文主要工作第22-23页
     ·论文的结构第23-24页
第二章 中文局部词法错误检测第24-38页
   ·中文文本常见字词错误类型第24-25页
   ·散串分析和对错误位置判定第25-28页
     ·单字成词概率对散串的判断第25-27页
     ·编校难点中的散串特点第27-28页
   ·字词的 N 元文法分析第28-29页
     ·建模方法第28页
     ·查错方法第28-29页
   ·Bloom Filter 在接续分析中的应用第29-31页
     ·Bloom Filter 介绍第29-30页
     ·构建基于 Bloom Filter 快速查错的功能字典第30-31页
   ·基于语料库的知识获取第31-37页
     ·语言要素概率计算第31-32页
     ·语料中知识获取流程第32-34页
     ·建立基于 3-gram 的词性分析隐马尔可夫模型第34-36页
     ·实现分析第36-37页
   ·小结第37-38页
第三章 基于 SVM 的组块分析与语块库的构建第38-50页
   ·语块的定义类别和表示第38-39页
   ·SVM 的相关理论第39-41页
     ·SVM 学习算法第39-40页
     ·SVM 的多分类方法第40-41页
   ·基于 SVM 的中文组块分析第41-47页
     ·词语的上下文特征第41页
     ·训练数据的准备第41-44页
     ·组块类型判定第44页
     ·分类模型构建和组块分析结果第44-47页
     ·实验结果分析第47页
     ·错误分析第47页
   ·构建用于校对的语块库第47-49页
   ·小结第49-50页
第四章 纠错建议的构建方法第50-62页
   ·常用混淆词典第51页
   ·中文字符(串)相似度的度量第51-54页
     ·基于拼音的度量第51-52页
     ·基于五笔码的度量第52-54页
     ·基于笔形序列的度量第54页
   ·基于笔形序列的相似字词查找第54-60页
     ·基于笔形的汉字相似度度量第54-56页
     ·相似字的查找算法第56-58页
     ·相似词的查找算法第58-60页
   ·实现分析第60-61页
   ·小结第61-62页
第五章 总结与展望第62-64页
致谢第64-65页
参考文献第65-69页
作者在学期间取得的学术成果第69页

论文共69页,点击 下载论文
上一篇:复杂分布式仿真系统互操作性分析度量及应用研究
下一篇:传统豆酱中微生物多样性分析