基于语义领域向量空间模型的文本相似度计算

摘要	第1-4页
Abstract	第4-8页
第一章绪论	第8-13页
·研究背景及意义	第8-9页
·文本相似度概述	第9-10页
·研究现状	第10-11页
·国外研究现状	第10页
·国内研究现状	第10-11页
·研究内容安排	第11-13页
第二章文本相似度理论基础	第13-23页
·文本结构化表示	第13页
·向量空间模型(VSM)	第13-18页
·空间向量模型的基本概念	第14-15页
·特征项选取	第15-16页
·特征值权重	第16页
·归一化处理	第16-17页
·相似度度量	第17-18页
·VSM模型的优点和问题	第18页
·其他文本相似度计算方法	第18-20页
·本体论(ontology)	第19页
·潜在语义标引	第19-20页
·文本预处理	第20-22页
·分词	第20-21页
·停用词过滤	第21-22页
本章小结	第22-23页
第三章基于语义领域的向量空间模型	第23-38页
·中文文本语义分析	第23-24页
·语义领域向量空间和特征项	第24-25页
·特征向量表示	第25-26页
·特征项量化	第26页
·语义关联	第26-31页
·语义关联图定义	第26-30页
·基于Hownet的语义关联图构建	第30-31页
·确定特征向量	第31-33页
·自定义加权	第33-35页
·文本相似度衡量	第35-36页
·小型文本相似度计算实例	第36-37页
本章小结	第37-38页
第四章一种基于同义词词林过滤的优化算法	第38-46页
·问题的提出	第38页
·同义词词林	第38-40页
·同义词词林编码	第39-40页
·同义词相似度计算	第40-41页
·基于同义词词林特征项过滤	第41-43页
·同义词合并层级选择	第41-42页
·同义词过滤算法	第42-43页
·文本相似度评价	第43页
·基于阈值的文本分类	第43-45页
·阈值的确定	第44页
·分类评估	第44-45页
本章小结	第45-46页
第五章系统设计与结果分析	第46-56页
·文本分类系统设计	第46页
·功能模块分析	第46-50页
·实验数据分析	第50-55页
·人工测试	第51-53页
·自动测试	第53-55页
本章小结	第55-56页
第六章总结与展望	第56-58页
·总结	第56-57页
·展望	第57-58页
参考文献	第58-62页
致谢	第62页