首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于K-means的中文文本精确聚类算法研究

摘要第1-6页
Abstract第6-10页
第1章 绪论第10-15页
   ·研究背景及意义第10-11页
   ·国内外研究现状第11-12页
   ·文本聚类的难点第12-13页
   ·本文的研究内容第13-14页
   ·本文的组织结构第14-15页
第2章 中文文本聚类的关键技术第15-25页
   ·文本聚类第15-16页
   ·文本预处理第16-18页
     ·中文分词第16-18页
     ·停用词处理第18页
   ·文本表示第18-19页
   ·文本相似度度量第19-22页
   ·降维处理第22-23页
   ·聚类算法第23-24页
   ·本章小结第24-25页
第3章 一种高效的无监督特征选择方法第25-39页
   ·特征选择概述第25-29页
     ·特征选择的工作原理第25-26页
     ·常用的无监督文本特征选择方法第26-29页
   ·基于聚类和单词贡献度的无监督特征选择第29-35页
     ·相关定义第29-30页
     ·特征分析第30-31页
     ·算法思想第31页
     ·特征聚类的预备知识第31-32页
     ·基于聚类的特征初步筛选第32-34页
     ·基于聚类和单词贡献度的特征选择第34-35页
   ·算法流程图第35页
   ·算法描述第35-36页
   ·算法分析第36-38页
     ·正确性分析第36-37页
     ·参数设置分析第37页
     ·时间复杂度分析第37-38页
   ·本章小结第38-39页
第4章 基于信息熵的精确赋权K-means聚类算法第39-51页
   ·文本聚类概述第39-42页
     ·文本聚类的工作原理第39-40页
     ·常用的三种文本聚类算法第40-42页
   ·基于信息熵的精确赋权K-means聚类算法第42-48页
     ·相关定义第42-43页
     ·信息熵的意义第43页
     ·K-means算法分析第43-45页
     ·算法思想第45页
     ·特征权值的计算方法第45-46页
     ·新的初始聚类中心选择方法第46-47页
     ·基于信息熵的精确赋权K-means算法第47-48页
   ·算法描述第48-49页
   ·算法分析第49-50页
     ·正确性分析第49页
     ·参数设置分析第49-50页
     ·时间复杂度分析第50页
   ·本章小结第50-51页
第5章 实验与结果分析第51-61页
   ·实验环境设置第51页
   ·实验内容第51-52页
   ·实验结果评价指标第52-53页
   ·实验结果与分析第53-60页
     ·特征选择方法的实验分析第53-57页
     ·聚类算法的实验分析第57-60页
   ·本章小结第60-61页
结论第61-63页
参考文献第63-67页
攻读硕士学位期间承担的科研任务与主要成果第67-68页
致谢第68-69页
作者简介第69页

论文共69页,点击 下载论文
上一篇:多个扩张器临床应用的经验总结
下一篇:不同跨高比钢纤维混凝土连梁试验研究