首页--文化、科学、教育、体育论文--科学、科学研究论文--科学研究工作论文--组织和管理论文

基于非分词技术的科技项目查重研究与实现

中文摘要第1-4页
英文摘要第4-8页
1 绪论第8-13页
   ·引言第8-9页
   ·中文文本相似度计算理论介绍第9页
   ·国内外研究进展第9-10页
     ·表示模型第9页
     ·特征提取第9-10页
     ·特征权值第10页
     ·后缀树第10页
     ·相似度计算公式第10页
   ·论文的主要思想和工作第10-11页
     ·本文的新思想第10-11页
     ·本文的主要工作第11页
   ·论文的结构安排第11-13页
2 中文文本相似度计算第13-16页
   ·自然语言处理第13页
   ·特征提取第13-14页
   ·表示模型第14页
   ·特征权值第14-15页
   ·相似度计算第15页
   ·本章小结第15-16页
3 特征提取第16-28页
   ·中文分词概述第16页
   ·词典分词法第16-18页
   ·统计分词法第18-19页
   ·混合分词法第19页
   ·ICTCLAS第19页
   ·后缀树概述第19-20页
   ·后缀树构建算法第20-21页
   ·Ukkonen 算法第21-27页
     ·字符串的特别处理第21-22页
     ·隐式后缀树第22页
     ·Ukkonen 算法概述第22-23页
     ·扩展规则第23页
     ·降低计算复杂度第23-25页
     ·Ukkonen 算法详细描述第25-27页
   ·本章小结第27-28页
4 频繁闭项集第28-39页
   ·频繁项集第28-31页
     ·基本概念第28-29页
     ·频繁项集算法第29-31页
   ·频繁闭项集第31-37页
     ·基本概念第31-33页
     ·频繁闭项集算法综述第33页
     ·CHARM 算法第33-37页
   ·本章小结第37-39页
5 一种基于非分词技术的科技项目查重算法及实现第39-55页
   ·算法概要第39-40页
   ·文本清理第40页
   ·C-SuffixTree 构建算法第40-44页
   ·挖掘频繁闭项集第44-46页
   ·构建FCSNV第46-47页
   ·相似度计算第47页
   ·算法实现第47-50页
     ·系统框架第47-48页
     ·Remoting第48-50页
   ·实验第50-54页
     ·实验模型第50页
     ·实验数据第50-52页
     ·实验结果第52-54页
   ·本章小结第54-55页
6 总结第55-56页
致谢第56-57页
参考文献第57-59页
附录第59页
 A. 硕士学位期间发表的学术论文第59页
 B. 作者在攻读学位期间参加的科研项目第59页

论文共59页,点击 下载论文
上一篇:基于FPGA的线阵光栅光调制器驱动控制系统设计与实验
下一篇:当代科技创新伦理冲突的哲学反思