基于划分与层次的文本聚类研究

摘要	第1-8页
Abstract	第8-10页
第一章绪论	第10-16页
·选题背景与研究意义	第10-12页
·文本聚类的研究现状	第12-13页
·研究中存在的问题	第13-14页
·本文的主要研究工作	第14页
·本文的内容安排	第14-16页
第二章文本聚类算法基础理论	第16-25页
·聚类的定义	第16页
·主要聚类算法分类	第16-22页
·基于顺序的聚类算法	第17-18页
·基于层次的聚类算法	第18-20页
·基于函数最优化的聚类算法	第20-22页
·其他的特殊聚类技术	第22页
·文本数据集	第22-24页
·Reuters21578 数据集	第23页
·20_NewsGroup 数据集	第23页
·WebKB 数据集	第23页
·TDT 数据集	第23页
·OHSUMED 数据集	第23-24页
·本章小结	第24-25页
第三章文本聚类关键技术	第25-34页
·分词	第25-27页
·STEMMING	第27-28页
·停用词处理	第28页
·空间降维	第28-31页
·文本表示方法	第31-32页
·相似性度量	第32-33页
·本章小结	第33-34页
第四章基于可变阈值的 K-MEANS 聚类器	第34-43页
·K-MEANS 算法简介	第34-37页
·VTK-MEANS 算法	第37-38页
·VTK-MEANS 算法时间复杂度分析	第38-39页
·实验结果与分析	第39-42页
·本章小结	第42-43页
第五章引入信息增益的层次聚类器	第43-50页
·CURE 算法	第44-45页
·信息增益	第45-46页
·IG-CURE 算法	第46页
·实验结果与分析	第46-49页
·本章小结	第49-50页
第六章总结与展望	第50-52页
·本文主要创新和贡献	第50-51页
·下一步工作	第51-52页
参考文献	第52-55页
攻读硕士学位期间发表的论文	第55-56页
致谢	第56页