基于译文特征与译文内容的中英文跨语种抄袭识别技术研究

摘要	第1-5页
ABSTRACT	第5-9页
第一章绪论	第9-15页
·国内外抄袭状况背景	第9-10页
·抄袭识别的基本问题	第10-12页
·抄袭行为分类	第10-11页
·抄袭检测常用的算法	第11页
·现有的反抄袭系统	第11-12页
·中英抄袭识别算法国内外研究现状	第12-13页
·国外研究现状	第12-13页
·国内研究现状	第13页
·中英文抄袭检测算法研究意义	第13-14页
·本文的工作	第14页
·本章小结	第14-15页
第二章自然语言处理技术	第15-32页
·分词	第15-20页
·基于词典的分词方法	第16-18页
·基于统计的方法	第18-19页
·词性标注	第19-20页
·句法分析	第20-21页
·语义分析	第21-22页
·文本表示模型	第22-25页
·布尔模型	第22-23页
·向量空间模型	第23-24页
·概率检索模型	第24页
·语言模型	第24-25页
·特征提取	第25-27页
·特征词的文档频率(DF)	第25页
·信息增益方法(IG)	第25-26页
·互信息方法	第26页
·χ~2 统计量(CHI)	第26-27页
·文本自动分类方法	第27-31页
·支持向量机(SVM)	第28-30页
·决策树算法	第30-31页
·本章小结	第31-32页
第三章基于译文特征的跨语种抄袭识别	第32-58页
·现代汉语的欧化现象与翻译腔	第32-37页
·恶意欧化现象	第33-35页
·翻译腔	第35-37页
·翻译文章的行文特征	第37-39页
·算法实现	第39-49页
·建立原始语料库	第40-42页
·分词与词性标注	第42-44页
·译文特征的获取	第44-48页
·决策树与SVM 分类训练	第48-49页
·实验数据与分析	第49-57页
·译文特征统计数据	第49-51页
·分类训练结果	第51-54页
·模型性能评估	第54-57页
·本章小结	第57-58页
第四章基于内容的跨语种抄袭识别	第58-68页
·相似度	第58-62页
·句子相似度	第58-59页
·篇章相似度	第59-60页
·语义相似度	第60-61页
·跨语种抄袭识别中的相似度	第61-62页
·语料库的建立	第62-63页
·倒排索引	第62-63页
·词干化工具WordNet	第63页
·算法实现	第63-64页
·实验结果与分析	第64-67页
·本章小结	第67-68页
第五章跨语种抄袭识别系统	第68-71页
·系统实现	第68-70页
·本章小结	第70-71页
第六章总结与展望	第71-72页
·主要结论	第71页
·研究展望	第71-72页
参考文献	第72-74页
致谢	第74-75页
攻读学位期间已发表或录用的学术论文	第75-77页