改进的K均值算法在中文文本聚类中的研究

摘要	第1-5页
Abstract	第5-7页
目录	第7-9页
第一章绪论	第9-14页
·研究背景	第9-10页
·课题研究的理论和实际意义	第10-11页
·国内外研究现状	第11-12页
·主要研究内容及安排	第12-14页
第二章主要聚类方法介绍	第14-23页
·划分方法(partitioning methods)	第14-15页
·基本思想	第14页
·代表算法	第14-15页
·该算法的优缺点	第15页
·基于密度的方法(density-based methods)	第15-17页
·基本思想	第15-16页
·代表算法	第16-17页
·基于模型的方法(model-based methods)	第17-18页
·基本思想	第17页
·期望最大化算法(EM)	第17-18页
·神经网络方法	第18页
·层次聚类方法(hierarchical method)	第18-20页
·基本思想	第18-19页
·代表算法	第19-20页
·优缺点	第20页
·基于网格的方法(gird-based metods)	第20-21页
·基本思想	第21页
·代表算法	第21页
·优缺点	第21页
·基于模糊的方法(fuzzy clustering)	第21-23页
第三章文本聚类的相关技术	第23-32页
·基本概念和定义	第23-28页
·聚类分析的数据类型	第23-24页
·文本间距离	第24-26页
·文本表示模型及权值计算	第26-28页
·文本聚类预处理	第28-32页
·分词	第28-29页
·词干提取	第29页
·停用词处理	第29-30页
·特征选择	第30-32页
第四章改进的K均值算法	第32-43页
·K均值算法的思想和流程	第32-34页
·二分K均值算法的思想和流程	第34-35页
·合作二分K均值算法	第35-41页
·整体聚类阶段	第36页
·合作聚类阶段	第36-37页
·融合阶段	第37-41页
·合作二分K均值算法时间复杂度分析	第41-43页
第五章系统实现与实验结果分析	第43-50页
·软硬件环境	第43页
·评价标准	第43-45页
·F度量	第43-44页
·平均纯度	第44页
·互信息	第44-45页
·熵	第45页
·功能模块设计	第45-47页
·语料库	第47页
·聚类实验结果分析	第47-50页
第六章总结与展望	第50-51页
参考文献	第51-55页
攻读学位期间发表的论文	第55-56页
致谢	第56-57页