首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

科技项目检测系统的构建及算法研究

摘要第1-4页
ABSTRACT第4-8页
第一章 绪论第8-13页
   ·选题背景及意义第8-9页
     ·选题背景第8-9页
     ·选题意义第9页
   ·国内外研究现状及发展趋势第9-11页
     ·文本内容分析研究第10页
     ·文本相似性检测第10-11页
   ·本文研究思路及要解决的问题第11-13页
     ·主要研究思路第11页
     ·本文的主要工作第11页
     ·要解决的问题第11-13页
第二章 剽窃检测算法的介绍第13-19页
   ·剽窃的概述第13-14页
   ·剽窃检测的软件工具第14-15页
     ·COPS第14页
     ·SCAM第14-15页
     ·SNITCH第15页
     ·其他的商业工具第15页
   ·剽窃检测的算法第15-18页
     ·文体学算法第16页
     ·基于词频度的算法第16-17页
     ·基于句式的算法第17-18页
   ·小结第18-19页
第三章 文本分词技术第19-32页
   ·正向最大分词匹配法第19-20页
   ·逆向最大分词匹配法第20-22页
   ·双向最少分词法第22-23页
   ·最短路径法第23-24页
   ·基于统计的分词法第24-27页
     ·基于 N-gram 模型的统计概率分词法第24-25页
     ·最大熵法第25-27页
   ·最长回溯上下文分词法第27-31页
     ·最长回溯上下文分词法模型第27-28页
     ·未登录词识别第28-29页
     ·最长回溯上下文分词法实现第29-31页
   ·小结第31-32页
第四章 科技项目检测系统的算法研究第32-43页
   ·编辑距离第32-35页
     ·基于字比较的编辑距离第32-33页
     ·基于词比较的编辑距离第33-35页
   ·可标识史密斯检测算法第35-38页
     ·基于字的可标识史密斯检测算法第36-37页
     ·基于词的可标识史密斯检测算法第37-38页
   ·基于 N-GRAM的 VSM 算法第38-42页
     ·相似度计算公式第39-40页
     ·N-gram 状态转移概率计算第40-41页
     ·基于 N-gram 的 VSM 模型实现第41-42页
   ·小结第42-43页
第五章 科技项目检测系统的设计与实现第43-56页
   ·系统分析第43-44页
   ·系统功能设计第44-45页
   ·内容解析模块第45-48页
     ·预处理模块第45-46页
     ·词典架构模块第46-47页
     ·分词模块第47-48页
   ·相似度计算模块第48-49页
     ·标题的检索第48-49页
     ·关键词的相似度第49页
     ·正文的相似度第49页
   ·系统实现第49-54页
     ·开发工具第50-52页
     ·系统界面第52-54页
   ·实验结果与分析第54-55页
   ·小结第55-56页
第六章 总结与展望第56-58页
   ·本文工作总结第56-57页
   ·工作展望第57-58页
参考文献第58-61页
个人简历 在读期间发表的学术论文第61-62页
致谢第62页

论文共62页,点击 下载论文
上一篇:基于PHP的接触网巡检管理信息系统的研究与实现
下一篇:基于DCT的数字水印算法研究及其应用