基于译文特征与译文内容的中英文跨语种抄袭识别技术研究
摘要 | 第1-5页 |
ABSTRACT | 第5-9页 |
第一章 绪论 | 第9-15页 |
·国内外抄袭状况背景 | 第9-10页 |
·抄袭识别的基本问题 | 第10-12页 |
·抄袭行为分类 | 第10-11页 |
·抄袭检测常用的算法 | 第11页 |
·现有的反抄袭系统 | 第11-12页 |
·中英抄袭识别算法国内外研究现状 | 第12-13页 |
·国外研究现状 | 第12-13页 |
·国内研究现状 | 第13页 |
·中英文抄袭检测算法研究意义 | 第13-14页 |
·本文的工作 | 第14页 |
·本章小结 | 第14-15页 |
第二章 自然语言处理技术 | 第15-32页 |
·分词 | 第15-20页 |
·基于词典的分词方法 | 第16-18页 |
·基于统计的方法 | 第18-19页 |
·词性标注 | 第19-20页 |
·句法分析 | 第20-21页 |
·语义分析 | 第21-22页 |
·文本表示模型 | 第22-25页 |
·布尔模型 | 第22-23页 |
·向量空间模型 | 第23-24页 |
·概率检索模型 | 第24页 |
·语言模型 | 第24-25页 |
·特征提取 | 第25-27页 |
·特征词的文档频率(DF) | 第25页 |
·信息增益方法(IG) | 第25-26页 |
·互信息方法 | 第26页 |
·χ~2 统计量(CHI) | 第26-27页 |
·文本自动分类方法 | 第27-31页 |
·支持向量机(SVM) | 第28-30页 |
·决策树算法 | 第30-31页 |
·本章小结 | 第31-32页 |
第三章 基于译文特征的跨语种抄袭识别 | 第32-58页 |
·现代汉语的欧化现象与翻译腔 | 第32-37页 |
·恶意欧化现象 | 第33-35页 |
·翻译腔 | 第35-37页 |
·翻译文章的行文特征 | 第37-39页 |
·算法实现 | 第39-49页 |
·建立原始语料库 | 第40-42页 |
·分词与词性标注 | 第42-44页 |
·译文特征的获取 | 第44-48页 |
·决策树与SVM 分类训练 | 第48-49页 |
·实验数据与分析 | 第49-57页 |
·译文特征统计数据 | 第49-51页 |
·分类训练结果 | 第51-54页 |
·模型性能评估 | 第54-57页 |
·本章小结 | 第57-58页 |
第四章 基于内容的跨语种抄袭识别 | 第58-68页 |
·相似度 | 第58-62页 |
·句子相似度 | 第58-59页 |
·篇章相似度 | 第59-60页 |
·语义相似度 | 第60-61页 |
·跨语种抄袭识别中的相似度 | 第61-62页 |
·语料库的建立 | 第62-63页 |
·倒排索引 | 第62-63页 |
·词干化工具WordNet | 第63页 |
·算法实现 | 第63-64页 |
·实验结果与分析 | 第64-67页 |
·本章小结 | 第67-68页 |
第五章 跨语种抄袭识别系统 | 第68-71页 |
·系统实现 | 第68-70页 |
·本章小结 | 第70-71页 |
第六章 总结与展望 | 第71-72页 |
·主要结论 | 第71页 |
·研究展望 | 第71-72页 |
参考文献 | 第72-74页 |
致谢 | 第74-75页 |
攻读学位期间已发表或录用的学术论文 | 第75-77页 |