首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

改进的K均值算法在中文文本聚类中的研究

摘要第1-5页
Abstract第5-7页
目录第7-9页
第一章 绪论第9-14页
   ·研究背景第9-10页
   ·课题研究的理论和实际意义第10-11页
   ·国内外研究现状第11-12页
   ·主要研究内容及安排第12-14页
第二章 主要聚类方法介绍第14-23页
   ·划分方法(partitioning methods)第14-15页
     ·基本思想第14页
     ·代表算法第14-15页
     ·该算法的优缺点第15页
   ·基于密度的方法(density-based methods)第15-17页
     ·基本思想第15-16页
     ·代表算法第16-17页
   ·基于模型的方法(model-based methods)第17-18页
     ·基本思想第17页
     ·期望最大化算法(EM)第17-18页
     ·神经网络方法第18页
   ·层次聚类方法(hierarchical method)第18-20页
     ·基本思想第18-19页
     ·代表算法第19-20页
     ·优缺点第20页
   ·基于网格的方法(gird-based metods)第20-21页
     ·基本思想第21页
     ·代表算法第21页
     ·优缺点第21页
   ·基于模糊的方法(fuzzy clustering)第21-23页
第三章 文本聚类的相关技术第23-32页
   ·基本概念和定义第23-28页
     ·聚类分析的数据类型第23-24页
     ·文本间距离第24-26页
     ·文本表示模型及权值计算第26-28页
   ·文本聚类预处理第28-32页
     ·分词第28-29页
     ·词干提取第29页
     ·停用词处理第29-30页
     ·特征选择第30-32页
第四章 改进的K均值算法第32-43页
   ·K均值算法的思想和流程第32-34页
   ·二分K均值算法的思想和流程第34-35页
   ·合作二分K均值算法第35-41页
     ·整体聚类阶段第36页
     ·合作聚类阶段第36-37页
     ·融合阶段第37-41页
   ·合作二分K均值算法时间复杂度分析第41-43页
第五章 系统实现与实验结果分析第43-50页
   ·软硬件环境第43页
   ·评价标准第43-45页
     ·F度量第43-44页
     ·平均纯度第44页
     ·互信息第44-45页
     ·熵第45页
   ·功能模块设计第45-47页
   ·语料库第47页
   ·聚类实验结果分析第47-50页
第六章 总结与展望第50-51页
参考文献第51-55页
攻读学位期间发表的论文第55-56页
致谢第56-57页

论文共57页,点击 下载论文
上一篇:基于图割的多视点长景图构造
下一篇:流数据聚类算法研究