基于K-means的中文文本精确聚类算法研究

摘要	第1-6页
Abstract	第6-10页
第1章绪论	第10-15页
·研究背景及意义	第10-11页
·国内外研究现状	第11-12页
·文本聚类的难点	第12-13页
·本文的研究内容	第13-14页
·本文的组织结构	第14-15页
第2章中文文本聚类的关键技术	第15-25页
·文本聚类	第15-16页
·文本预处理	第16-18页
·中文分词	第16-18页
·停用词处理	第18页
·文本表示	第18-19页
·文本相似度度量	第19-22页
·降维处理	第22-23页
·聚类算法	第23-24页
·本章小结	第24-25页
第3章一种高效的无监督特征选择方法	第25-39页
·特征选择概述	第25-29页
·特征选择的工作原理	第25-26页
·常用的无监督文本特征选择方法	第26-29页
·基于聚类和单词贡献度的无监督特征选择	第29-35页
·相关定义	第29-30页
·特征分析	第30-31页
·算法思想	第31页
·特征聚类的预备知识	第31-32页
·基于聚类的特征初步筛选	第32-34页
·基于聚类和单词贡献度的特征选择	第34-35页
·算法流程图	第35页
·算法描述	第35-36页
·算法分析	第36-38页
·正确性分析	第36-37页
·参数设置分析	第37页
·时间复杂度分析	第37-38页
·本章小结	第38-39页
第4章基于信息熵的精确赋权K-means聚类算法	第39-51页
·文本聚类概述	第39-42页
·文本聚类的工作原理	第39-40页
·常用的三种文本聚类算法	第40-42页
·基于信息熵的精确赋权K-means聚类算法	第42-48页
·相关定义	第42-43页
·信息熵的意义	第43页
·K-means算法分析	第43-45页
·算法思想	第45页
·特征权值的计算方法	第45-46页
·新的初始聚类中心选择方法	第46-47页
·基于信息熵的精确赋权K-means算法	第47-48页
·算法描述	第48-49页
·算法分析	第49-50页
·正确性分析	第49页
·参数设置分析	第49-50页
·时间复杂度分析	第50页
·本章小结	第50-51页
第5章实验与结果分析	第51-61页
·实验环境设置	第51页
·实验内容	第51-52页
·实验结果评价指标	第52-53页
·实验结果与分析	第53-60页
·特征选择方法的实验分析	第53-57页
·聚类算法的实验分析	第57-60页
·本章小结	第60-61页
结论	第61-63页
参考文献	第63-67页
攻读硕士学位期间承担的科研任务与主要成果	第67-68页
致谢	第68-69页
作者简介	第69页