文本聚类算法的研究与实现

提要	第1-8页
第一章绪论	第8-14页
·文本挖掘的概念和意义	第8页
·文本聚类和文本分类	第8-9页
·文本聚类的概念	第8-9页
·文本分类的概念	第9页
·文本聚类和文本分类的区别	第9页
·文本聚类的过程	第9-10页
·文本聚类的研究现状	第10-11页
·文本聚类的特点与难点	第11页
·本文的组织结构	第11-13页
·本章小结	第13-14页
第二章相关概念介绍	第14-21页
·文本的特征向量	第14页
·文本之间的距离	第14-15页
·权值表示	第15页
·文本之间的相似系数	第15-16页
·文本类之间的距离	第16-17页
·数据的标准化	第17-18页
·文本的表示	第18-20页
·空间向量模型	第19页
·特征的抽取	第19-20页
·本章小结	第20-21页
第三章主要聚类算法的分析	第21-29页
·划分的方法	第22-24页
·算法概述	第22页
·基本思想	第22页
·典型代表算法 K－means	第22-24页
·基于密度的方法	第24-25页
·算法概述	第24页
·基本思想	第24页
·典型代表算法DBSCAN	第24-25页
·基于模型的方法	第25-27页
·算法概述	第25页
·典型代表算法SOM神经网络	第25-27页
·层次聚类方法	第27-28页
·基本思想	第27页
·算法描述	第27-28页
·基于网格的方法	第28页
·主要思想	第28页
·本章小结	第28-29页
第四章聚类算法的改进	第29-40页
·聚类过程	第29页
·传统聚类算法缺点分析	第29-32页
·传统聚类算法的缺点	第29-30页
·一个说明传统聚类的缺点的例子	第30-31页
·上例的启示	第31页
·SOM神经网络的拓扑结构和学习规则	第31-32页
·对传统聚类算法的改进	第32-39页
·方法概述	第32-33页
·对竞争层进行训练的算法	第33-36页
·用训练后竞争层的向量优化文本的特征向量	第36-37页
·算法流程图	第37-38页
·使用优化后的文本特征向量集聚类	第38-39页
·本章小结	第39-40页
第五章用改进后的算法进行文本聚类实验	第40-48页
·文本聚类的前期工作	第40-43页
·文本的预处理	第40-42页
·文本的表示—文本向量模型	第42-43页
·改进的文本聚类过程	第43-44页
·实验结果分析	第44-47页
·项目概述	第44页
·算法的平均准确率	第44-45页
·用DBSCAN算法进行聚类的实验结果	第45-46页
·用改进的算法进行聚类的实验结果	第46页
·实验结果得出的结论	第46-47页
·本章小结	第47-48页
第六章文本聚类的总结和展望	第48-50页
·总结	第48页
·展望	第48-50页
参考文献	第50-54页
摘要	第54-57页
Abstract	第57-60页
致谢	第60-61页
导师及作者简介	第61页