基于k-平均算法的文本聚类系统研究与实现

摘要	第1-5页
Abstract	第5-8页
第1章绪论	第8-13页
·研究的背景	第8-10页
·研究的意义	第10-11页
·研究现状	第11-12页
·本文的主要内容及组织	第12-13页
第2章文本聚类关键技术	第13-28页
·自动分词	第14-16页
·基于词典的分词方法	第14-15页
·基于理解的分词方法	第15-16页
·基于统计的分词方法	第16页
·文本表示模型	第16-19页
·布尔模型	第17页
·向量空间模型	第17-18页
·概率模型	第18-19页
·特征项的选择	第19-21页
·信息增益	第19-20页
·互信息	第20页
·x~2(CHI)统计	第20-21页
·特征项的权重计算	第21-22页
·中文文本聚类算法	第22-27页
·划分聚类方法	第23-24页
·层次聚类方法	第24-26页
·基于密度的聚类方法	第26-27页
·基于网格的方法	第27页
·基于模型的方法	第27页
·本章小结	第27-28页
第3章文本预处理设计与实验	第28-41页
·分词模块设计	第28-35页
·分词设计	第28-32页
·歧义字段识别与处理	第32-34页
·中文文本分词实验	第34-35页
·文本表示设计	第35-40页
·特征缩减设计	第35-38页
·特征表示设计	第38-40页
·本章小结	第40-41页
第4章文本聚类设计与实验	第41-53页
·传统的k-平均算法	第42-44页
·初始参数的确定	第44-51页
·参数k的确定	第44-45页
·确定参数k的实验结果	第45-47页
·已有的初始聚类中心的选择方法	第47页
·基于密度的初始聚类中心选择方法	第47-50页
·确定初始聚类中心的实验结果	第50-51页
·基于k-平均值的文本二次聚类算法	第51-52页
·本章小结	第52-53页
第5章系统实现与实验结果分析	第53-63页
·系统的实现	第53-57页
·系统开发平台	第53页
·系统结构	第53-57页
·实验结果评价	第57-62页
·实验数据集	第57-58页
·聚类实验结果分析	第58-62页
·本章小结	第62-63页
第6章总结	第63-65页
参考文献	第65-68页
致谢	第68-69页
攻读硕士学位发表论文和参加科研情况	第69页