首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于译文特征与译文内容的中英文跨语种抄袭识别技术研究

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-15页
   ·国内外抄袭状况背景第9-10页
   ·抄袭识别的基本问题第10-12页
     ·抄袭行为分类第10-11页
     ·抄袭检测常用的算法第11页
     ·现有的反抄袭系统第11-12页
   ·中英抄袭识别算法国内外研究现状第12-13页
     ·国外研究现状第12-13页
     ·国内研究现状第13页
   ·中英文抄袭检测算法研究意义第13-14页
   ·本文的工作第14页
   ·本章小结第14-15页
第二章 自然语言处理技术第15-32页
   ·分词第15-20页
     ·基于词典的分词方法第16-18页
     ·基于统计的方法第18-19页
     ·词性标注第19-20页
   ·句法分析第20-21页
   ·语义分析第21-22页
   ·文本表示模型第22-25页
     ·布尔模型第22-23页
     ·向量空间模型第23-24页
     ·概率检索模型第24页
     ·语言模型第24-25页
   ·特征提取第25-27页
     ·特征词的文档频率(DF)第25页
     ·信息增益方法(IG)第25-26页
     ·互信息方法第26页
     ·χ~2 统计量(CHI)第26-27页
   ·文本自动分类方法第27-31页
     ·支持向量机(SVM)第28-30页
     ·决策树算法第30-31页
   ·本章小结第31-32页
第三章 基于译文特征的跨语种抄袭识别第32-58页
   ·现代汉语的欧化现象与翻译腔第32-37页
     ·恶意欧化现象第33-35页
     ·翻译腔第35-37页
   ·翻译文章的行文特征第37-39页
   ·算法实现第39-49页
     ·建立原始语料库第40-42页
     ·分词与词性标注第42-44页
     ·译文特征的获取第44-48页
     ·决策树与SVM 分类训练第48-49页
   ·实验数据与分析第49-57页
     ·译文特征统计数据第49-51页
     ·分类训练结果第51-54页
     ·模型性能评估第54-57页
   ·本章小结第57-58页
第四章 基于内容的跨语种抄袭识别第58-68页
   ·相似度第58-62页
     ·句子相似度第58-59页
     ·篇章相似度第59-60页
     ·语义相似度第60-61页
     ·跨语种抄袭识别中的相似度第61-62页
   ·语料库的建立第62-63页
     ·倒排索引第62-63页
     ·词干化工具WordNet第63页
   ·算法实现第63-64页
   ·实验结果与分析第64-67页
   ·本章小结第67-68页
第五章 跨语种抄袭识别系统第68-71页
   ·系统实现第68-70页
   ·本章小结第70-71页
第六章 总结与展望第71-72页
   ·主要结论第71页
   ·研究展望第71-72页
参考文献第72-74页
致谢第74-75页
攻读学位期间已发表或录用的学术论文第75-77页

论文共77页,点击 下载论文
上一篇:基于口令短语的PGP破解研究与实现
下一篇:基于稀疏编码与机器学习的图像内容识别算法研究