首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于特征提取的文本相似性判别方法研究与应用

摘要第1-8页
Abstract第8-10页
第一章 绪论第10-18页
   ·背景、目的和意义第10-12页
   ·国内外研究现状第12-14页
   ·论文的主要工作、创新点和研究意义第14-15页
     ·本文的主要工作第14页
     ·本文的主要创新点第14-15页
     ·论文的研究意义第15页
   ·论文的组织结构第15-18页
第二章 文本相似性判别概述第18-30页
   ·文本相似性判别的基本概念第18页
   ·文本相似性判别流程第18-21页
     ·文本预处理第19页
     ·文本特征提取第19-20页
     ·文本相似性判别第20-21页
   ·文本相似性判别的相关技术第21-30页
     ·中文文本分词技术第21-22页
     ·文本特征提取算法第22-24页
     ·主题词表构建方法第24-25页
     ·文本相似性计算模型第25-30页
第三章 二维特征集合概述第30-34页
   ·二维特征集合相关概念第30-32页
     ·二维特征集合的定义第30-31页
     ·二维特征集合的现实意义第31-32页
   ·二维特征集合的存储形式第32-34页
第四章 多特征主题词表的研究与实现第34-46页
   ·文本多特征提取的基本条件第34-35页
   ·多特征提取算法第35-40页
     ·TF 特征(Term Frequency)第35页
     ·DF 特征(Document Frequency)第35-36页
     ·TF-IDF 特征(Term Frequency & Inverse Document Frequency)第36页
     ·信息熵(Information Entropy)第36-37页
     ·词频分布熵(Term Distribution Entropy)第37-38页
     ·文本分布熵(Document Distribution Entropy)第38页
     ·Pearson 相关系数(Pearson Correlation Coefficient)第38-39页
     ·词条分布权值(Term Distribution Function)第39-40页
   ·多特征主题词表设计实现第40-46页
     ·多特征主题词表生成系统组成模块第40页
     ·词表生成系统的工作流程第40-41页
     ·性能测试与分析第41-46页
第五章 多特征文本相似性判别研究与实现第46-52页
   ·多特征文本相似性判别系统组成模块第46页
   ·多特征文本相似性判别流程第46-47页
   ·性能测试与分析第47-52页
     ·系统开发运行环境第47页
     ·实验数据及数据存储第47-48页
     ·文本相似性判别方法第48-50页
     ·实验结果分析第50-52页
第六章 总结与展望第52-54页
   ·全文总结第52页
   ·进一步研究设想第52-53页
   ·心得体会第53-54页
参考文献第54-58页
致谢第58-60页
附录第60页

论文共60页,点击 下载论文
上一篇:三维点云配准方法的研究
下一篇:基于距离的连续LOD地形渲染算法(CDLOD)的研究与实现