科技项目检测系统的构建及算法研究

摘要	第1-4页
ABSTRACT	第4-8页
第一章绪论	第8-13页
·选题背景及意义	第8-9页
·选题背景	第8-9页
·选题意义	第9页
·国内外研究现状及发展趋势	第9-11页
·文本内容分析研究	第10页
·文本相似性检测	第10-11页
·本文研究思路及要解决的问题	第11-13页
·主要研究思路	第11页
·本文的主要工作	第11页
·要解决的问题	第11-13页
第二章剽窃检测算法的介绍	第13-19页
·剽窃的概述	第13-14页
·剽窃检测的软件工具	第14-15页
·COPS	第14页
·SCAM	第14-15页
·SNITCH	第15页
·其他的商业工具	第15页
·剽窃检测的算法	第15-18页
·文体学算法	第16页
·基于词频度的算法	第16-17页
·基于句式的算法	第17-18页
·小结	第18-19页
第三章文本分词技术	第19-32页
·正向最大分词匹配法	第19-20页
·逆向最大分词匹配法	第20-22页
·双向最少分词法	第22-23页
·最短路径法	第23-24页
·基于统计的分词法	第24-27页
·基于 N-gram 模型的统计概率分词法	第24-25页
·最大熵法	第25-27页
·最长回溯上下文分词法	第27-31页
·最长回溯上下文分词法模型	第27-28页
·未登录词识别	第28-29页
·最长回溯上下文分词法实现	第29-31页
·小结	第31-32页
第四章科技项目检测系统的算法研究	第32-43页
·编辑距离	第32-35页
·基于字比较的编辑距离	第32-33页
·基于词比较的编辑距离	第33-35页
·可标识史密斯检测算法	第35-38页
·基于字的可标识史密斯检测算法	第36-37页
·基于词的可标识史密斯检测算法	第37-38页
·基于 N-GRAM的 VSM 算法	第38-42页
·相似度计算公式	第39-40页
·N-gram 状态转移概率计算	第40-41页
·基于 N-gram 的 VSM 模型实现	第41-42页
·小结	第42-43页
第五章科技项目检测系统的设计与实现	第43-56页
·系统分析	第43-44页
·系统功能设计	第44-45页
·内容解析模块	第45-48页
·预处理模块	第45-46页
·词典架构模块	第46-47页
·分词模块	第47-48页
·相似度计算模块	第48-49页
·标题的检索	第48-49页
·关键词的相似度	第49页
·正文的相似度	第49页
·系统实现	第49-54页
·开发工具	第50-52页
·系统界面	第52-54页
·实验结果与分析	第54-55页
·小结	第55-56页
第六章总结与展望	第56-58页
·本文工作总结	第56-57页
·工作展望	第57-58页
参考文献	第58-61页
个人简历在读期间发表的学术论文	第61-62页
致谢	第62页