首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

汉语文本抄袭识别系统研究

摘要第1-9页
ABSTRACT第9-11页
第1章 抄袭识别概述第11-17页
   ·抄袭识别的研究背景第11页
   ·抄袭的相关概念及分类第11-12页
     ·抄袭的相关概念第11-12页
     ·抄袭的种类第12页
   ·抄袭识别的研究现状第12-16页
     ·国外的研究现状第12-14页
     ·国内的研究现状第14-16页
   ·本文研究内容和文章的组织结构第16-17页
     ·研究内容第16页
     ·本文组织结构第16-17页
第2章 现有的原型系统、工具或服务网站第17-29页
   ·Siff工具第17页
   ·COPS原型系统第17-18页
   ·Ferret工具第18-22页
   ·WCopyfind工具第22-26页
   ·Turnitin服务网站第26-28页
   ·本章小结第28-29页
第3章 抄袭识别实现过程研究第29-52页
   ·中文分词第29-32页
     ·中文分词方法第29-30页
     ·现有的分词系统第30-32页
   1、ChineseTokenizer第30页
   2、雨痕分词组件第30-31页
   3、计算所汉语词法分析系统ICTCLAS第31页
   4、KTDictSeg第31-32页
   5、CSW中文分词组件第32页
     ·本文分词方法第32页
   ·文本相似度第32-43页
     ·文本相似度概述第33页
     ·计算文本相似度的算法第33-43页
   1、基于字符匹配的文本相似度度量第34-37页
   2、基于集合模型的相似度计算方法第37-39页
   3、基于向量空间模型的相似度计算第39-41页
   4、基于N-gram的相似度计算第41-42页
   5、多层次特征融合型相似度计算方法第42-43页
   ·文本比较第43-51页
     ·相关背景第44页
     ·相关概念第44-46页
     ·求所有公共子串算法第46-47页
     ·无重复最长公共子串的求解算法第47-49页
     ·基于分词的无重复最长公共子串第49-51页
   ·本章小结第51-52页
第4章 汉语文本抄袭识别系统的设计与介绍第52-63页
   ·汉语文本抄袭识别系统设计第52-55页
     ·文档注册模块第52-53页
     ·分词模块第53-54页
     ·抄袭识别模块第54-55页
     ·查询模块第55页
     ·后台维护模块第55页
   ·知识库的构建第55-58页
     ·同义词词表建立第55-57页
     ·分类表的建立第57-58页
     ·停用词词典的构建第58页
   ·系统及其实现流程的介绍第58-62页
     ·菜单介绍第58-59页
     ·系统实现的流程第59-62页
   ·本章小结第62-63页
第5章 实验及系统评测第63-72页
   ·实验环境第63-67页
     ·测试数据的选择第63-64页
     ·训练文档确定阈值第64-67页
   ·系统性能度量第67-71页
     ·相似方法的度量第67-69页
   1、响应时间度量第67-68页
   2、查准率度量第68-69页
     ·相似报告的度量第69-71页
   ·本章小结第71-72页
第6章 总结与展望第72-75页
   ·所做的工作第72页
   ·本文的创新之处第72-73页
   ·系统存在的不足及未来工作展望第73-75页
参考文献第75-78页
附录第78-81页
 附录A:相似报告样例第78-81页
  样例1 无重复最长公共子串的求解算法生成的相似报告第78-79页
  样例2 基于分词的无重复最长公共子串求解算法的相似报告第79-81页
致谢第81页

论文共81页,点击 下载论文
上一篇:基于Struts框架的图书馆手机服务系统通用访问平台的研究与实现
下一篇:开放获取期刊统一访问及全文检索平台研究