首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

改进K-Means算法在文本聚类中的应用

摘要第1-4页
Abstract第4-5页
目录第5-7页
绪论第7-14页
 一 课题研究的背景第7-8页
 二 课题研究的理论与实际意义第8-9页
 三 课题国内外研究现状第9-10页
 四 文本聚类面临的问题第10-12页
 五 论文的主要研究内容第12-14页
第一章 聚类分析的介绍第14-22页
   ·聚类的定义第14页
   ·聚类分析的应用第14-15页
   ·聚类分析的数据类型第15-16页
   ·主要聚类算法分类第16-21页
     ·划分方法(partitioning method)第16-17页
     ·层次方法(hierarchical method)第17-18页
     ·基于密度的方法(density-based method)第18-19页
     ·基于网格的方法 (grid-based method)第19页
     ·基于模型的方法 (model-based method)第19-20页
     ·基于模糊的方法 (fuzzy clustering)第20-21页
 本章小结第21-22页
第二章 文本聚类关键技术第22-32页
   ·分词第22-25页
   ·Stemming第25-26页
   ·停用词处理第26页
   ·特征选择第26-27页
   ·文本表示方法第27-29页
   ·相似性度量第29-30页
 本章小结第30-32页
第三章 K-Means算法改进研究第32-48页
   ·K-Means算法第32-36页
     ·算法解释第32-33页
     ·算法流程第33-34页
     ·算法的特点第34-35页
     ·K-means算法面临的主要问题第35-36页
   ·自适应选择最佳密度半径确定聚类中心第36-41页
     ·已有的初始中心选取方法第36-37页
     ·基于密度概念的初始中心选取方法第37-38页
     ·自适应选择最佳密度半径第38-39页
     ·实验分析第39-41页
   ·基于子空间变量自动加权第41-46页
     ·K-Means聚类加权的研究第41-43页
     ·子空间聚类第43页
     ·变量自动加权的K-Means算法第43-44页
     ·处理文本数据的稀疏性第44-46页
     ·算法分析第46页
 本章小结第46-48页
第四章 系统实现与实验结果分析第48-56页
   ·系统设计第48-49页
     ·系统体系结构第48页
     ·主要模块和功能说明第48-49页
   ·实验结果分析第49-55页
     ·文本数据集第49-50页
     ·聚类结果评价第50-51页
     ·确定聚类中心第51-52页
     ·聚类结果比较第52-54页
     ·聚类簇标引第54-55页
 本章小结第55-56页
结论第56-57页
参考文献第57-59页
附录A 公式推导及参数讨论第59-62页
攻读硕士学位期间发表的学术论文第62-63页
致谢第63页

论文共63页,点击 下载论文
上一篇:YKK公司中日员工和谐关系案例研究
下一篇:我国农村土地使用权的市场化流转机制探究