首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于向量空间模型的文本相似度算法研究

摘要第1-4页
Abstract第4-5页
目录第5-7页
第1章 绪论第7-12页
   ·研究背景及意义第7-8页
   ·国内外研究现状第8-10页
     ·国外研究现状第8页
     ·国内研究现状第8-10页
     ·存在的主要问题第10页
   ·本文主要研究内容及章节安排第10-12页
     ·主要研究内容第10-11页
     ·章节安排第11-12页
第2章 文本相似度计算相关技术概述第12-26页
   ·文本相似度的基本概念第12页
   ·文本预处理第12-14页
     ·文本分词第12-13页
     ·去停用词第13-14页
   ·特征项选取第14页
   ·特征项权重计算方法第14-17页
   ·文本表示法第17-22页
     ·布尔模型第17-18页
     ·概率模型第18-20页
     ·向量空间模型(VSM)第20-22页
   ·文本相似度计算第22-24页
     ·相似度度量第22-23页
     ·距离度量第23-24页
     ·余弦相似度和欧几里得距离第24页
   ·本章小结第24-26页
第3章 文本段向量空间模型第26-34页
   ·文本结构第26-27页
     ·结构化信息与半结构化信息第26-27页
     ·文本结构分析第27页
   ·文本分段第27-28页
   ·特征项权重计算第28-29页
   ·文本表示第29-30页
   ·相似度计算第30-32页
   ·基于文本段的向量空间模型第32页
   ·本章小结第32-34页
第4章 向量空间模型的改进第34-43页
   ·问题的提出第34页
   ·自主加权文本段向量空间模型第34-37页
   ·基于非零权值向量的相似度算法第37-42页
     ·传统相似度度量分析第37页
     ·非零权值向量第37-42页
   ·本章小结第42-43页
第5章 实验与性能分析第43-52页
   ·实验介绍第43-48页
     ·实验目的第43页
     ·实验流程第43-45页
     ·文本过滤系统第45-48页
   ·性能分析第48-51页
     ·自主加权文本段向量空间模型性能分析第48-50页
     ·非零权值并集向量空间模型性能分析第50页
     ·非零权值基准向量空间模型性能分析第50-51页
     ·实验结论第51页
   ·本章小结第51-52页
第6章 总结与展望第52-54页
   ·本文工作总结第52-53页
   ·工作展望第53-54页
致谢第54-55页
参考文献第55-58页
攻读硕士学位期间发表的论文及科研成果第58页

论文共58页,点击 下载论文
上一篇:海量数据存储和准实时查询系统设计与实现
下一篇:油气集输SCADA安全防御解析型因素神经网络关系模型研究