基于特征提取的文本相似性判别方法研究与应用

摘要	第1-8页
Abstract	第8-10页
第一章绪论	第10-18页
·背景、目的和意义	第10-12页
·国内外研究现状	第12-14页
·论文的主要工作、创新点和研究意义	第14-15页
·本文的主要工作	第14页
·本文的主要创新点	第14-15页
·论文的研究意义	第15页
·论文的组织结构	第15-18页
第二章文本相似性判别概述	第18-30页
·文本相似性判别的基本概念	第18页
·文本相似性判别流程	第18-21页
·文本预处理	第19页
·文本特征提取	第19-20页
·文本相似性判别	第20-21页
·文本相似性判别的相关技术	第21-30页
·中文文本分词技术	第21-22页
·文本特征提取算法	第22-24页
·主题词表构建方法	第24-25页
·文本相似性计算模型	第25-30页
第三章二维特征集合概述	第30-34页
·二维特征集合相关概念	第30-32页
·二维特征集合的定义	第30-31页
·二维特征集合的现实意义	第31-32页
·二维特征集合的存储形式	第32-34页
第四章多特征主题词表的研究与实现	第34-46页
·文本多特征提取的基本条件	第34-35页
·多特征提取算法	第35-40页
·TF 特征(Term Frequency)	第35页
·DF 特征(Document Frequency)	第35-36页
·TF-IDF 特征(Term Frequency & Inverse Document Frequency)	第36页
·信息熵(Information Entropy)	第36-37页
·词频分布熵(Term Distribution Entropy)	第37-38页
·文本分布熵(Document Distribution Entropy)	第38页
·Pearson 相关系数(Pearson Correlation Coefficient)	第38-39页
·词条分布权值(Term Distribution Function)	第39-40页
·多特征主题词表设计实现	第40-46页
·多特征主题词表生成系统组成模块	第40页
·词表生成系统的工作流程	第40-41页
·性能测试与分析	第41-46页
第五章多特征文本相似性判别研究与实现	第46-52页
·多特征文本相似性判别系统组成模块	第46页
·多特征文本相似性判别流程	第46-47页
·性能测试与分析	第47-52页
·系统开发运行环境	第47页
·实验数据及数据存储	第47-48页
·文本相似性判别方法	第48-50页
·实验结果分析	第50-52页
第六章总结与展望	第52-54页
·全文总结	第52页
·进一步研究设想	第52-53页
·心得体会	第53-54页
参考文献	第54-58页
致谢	第58-60页
附录	第60页