首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

文本聚类算法的研究与实现

提要第1-8页
第一章 绪论第8-14页
   ·文本挖掘的概念和意义第8页
   ·文本聚类和文本分类第8-9页
     ·文本聚类的概念第8-9页
     ·文本分类的概念第9页
     ·文本聚类和文本分类的区别第9页
   ·文本聚类的过程第9-10页
   ·文本聚类的研究现状第10-11页
   ·文本聚类的特点与难点第11页
   ·本文的组织结构第11-13页
   ·本章小结第13-14页
第二章 相关概念介绍第14-21页
   ·文本的特征向量第14页
   ·文本之间的距离第14-15页
   ·权值表示第15页
   ·文本之间的相似系数第15-16页
   ·文本类之间的距离第16-17页
   ·数据的标准化第17-18页
   ·文本的表示第18-20页
     ·空间向量模型第19页
     ·特征的抽取第19-20页
   ·本章小结第20-21页
第三章 主要聚类算法的分析第21-29页
   ·划分的方法第22-24页
     ·算法概述第22页
     ·基本思想第22页
     ·典型代表算法 K-means第22-24页
   ·基于密度的方法第24-25页
     ·算法概述第24页
     ·基本思想第24页
     ·典型代表算法DBSCAN第24-25页
   ·基于模型的方法第25-27页
     ·算法概述第25页
     ·典型代表算法SOM神经网络第25-27页
   ·层次聚类方法第27-28页
     ·基本思想第27页
     ·算法描述第27-28页
   ·基于网格的方法第28页
     ·主要思想第28页
   ·本章小结第28-29页
第四章 聚类算法的改进第29-40页
   ·聚类过程第29页
   ·传统聚类算法缺点分析第29-32页
     ·传统聚类算法的缺点第29-30页
     ·一个说明传统聚类的缺点的例子第30-31页
     ·上例的启示第31页
     ·SOM神经网络的拓扑结构和学习规则第31-32页
   ·对传统聚类算法的改进第32-39页
     ·方法概述第32-33页
     ·对竞争层进行训练的算法第33-36页
     ·用训练后竞争层的向量优化文本的特征向量第36-37页
     ·算法流程图第37-38页
     ·使用优化后的文本特征向量集聚类第38-39页
   ·本章小结第39-40页
第五章 用改进后的算法进行文本聚类实验第40-48页
   ·文本聚类的前期工作第40-43页
     ·文本的预处理第40-42页
     ·文本的表示—文本向量模型第42-43页
   ·改进的文本聚类过程第43-44页
   ·实验结果分析第44-47页
     ·项目概述第44页
     ·算法的平均准确率第44-45页
     ·用DBSCAN算法进行聚类的实验结果第45-46页
     ·用改进的算法进行聚类的实验结果第46页
     ·实验结果得出的结论第46-47页
   ·本章小结第47-48页
第六章 文本聚类的总结和展望第48-50页
   ·总结第48页
   ·展望第48-50页
参考文献第50-54页
摘要第54-57页
Abstract第57-60页
致谢第60-61页
导师及作者简介第61页

论文共61页,点击 下载论文
上一篇:基于Lucene的垂直搜索引擎设计
下一篇:基于椭球颗粒模型的离散元法基本理论及算法研究