首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于后缀树的文本聚类方法研究

摘要第1-6页
Abstract第6-10页
第一章 绪论第10-14页
   ·研究背景和意义第10页
   ·研究现状第10-12页
     ·文本聚类的研究现状第10-11页
     ·基于后缀树文本聚类的研究现状第11-12页
   ·本文的主要内容和组织结构第12-14页
第二章 文本聚类的相关技术第14-26页
   ·文本聚类介绍第14-15页
     ·聚类的概念第14页
     ·文本聚类的概念第14-15页
   ·文本聚类过程第15页
   ·文本预处理第15-16页
   ·文本表示模型第16-19页
     ·布尔模型第16-17页
     ·向量空间模型第17-18页
     ·概率模型第18-19页
     ·语言模型第19页
     ·其他表示模型第19页
   ·文本相似度的定义第19-21页
     ·文本与文本的相似度第20页
     ·文本簇与文本簇的相似度第20-21页
     ·文本与文本簇的相似度第21页
   ·文本聚类算法第21-23页
     ·基于划分的聚类算法第21页
     ·基于层次的聚类算法第21-22页
     ·基于密度的聚类算法第22页
     ·基于模型的聚类算法第22-23页
     ·其他聚类算法第23页
   ·文本聚类结果评价第23-25页
   ·本章小结第25-26页
第三章 后缀树聚类算法第26-35页
   ·后缀树的概念第26-30页
     ·Trie 树第26-27页
     ·基数树第27-28页
     ·后缀树第28-29页
     ·广义后缀树第29页
     ·后缀树构造算法第29-30页
     ·后缀树的应用第30页
   ·后缀树聚类算法第30-33页
     ·STC 算法的相关概念第30-31页
     ·STC 聚类过程第31-33页
   ·STC 算法的特点和不足第33-34页
   ·本章小结第34-35页
第四章 基于后缀树的文本表示方法第35-45页
   ·基于短语的文本表示方法第35-36页
   ·后缀树文本模型第36-38页
     ·后缀树文本模型介绍第36-37页
     ·后缀树文本模型的特点第37-38页
   ·基于后缀树的向量空间模型第38-40页
     ·STVSD 的构造第38-39页
     ·STVSD 的优化第39-40页
   ·基于加权后缀树的向量空间模型第40-44页
     ·文本的加权表示第40-41页
     ·加权后缀树的定义第41-43页
     ·WSTVSD 的构造第43-44页
   ·本章小结第44-45页
第五章 实验结果第45-54页
   ·实验步骤第45-49页
     ·选取文本数据集第46页
     ·文本预处理第46-48页
     ·构造文本向量第48-49页
     ·文本聚类和结果评价第49页
   ·实验结果第49-53页
     ·四种文本表示方法的聚类质量第49-52页
     ·不同权重调节因子对 IWSTVSD 改进效果的影响第52-53页
     ·后缀树短语长度第53页
   ·本章小结第53-54页
结论第54-56页
参考文献第56-62页
攻读硕士学位期间取得的研究成果第62-63页
致谢第63-65页
附件第65页

论文共65页,点击 下载论文
上一篇:基于云计算的人脸识别系统研究与实现
下一篇:基于社会资本视角的网络口碑与购买意愿关系研究