SOFM文本聚类算法研究

摘要	第5-6页
Abstract	第6页
第1章绪论	第11-17页
1.1 课题的背景和意义	第11-12页
1.1.1 研究背景	第11-12页
1.1.2 研究意义	第12页
1.2 国内外研究现状	第12-15页
1.3 主要研究内容及创新	第15-16页
1.4 论文组织结构	第16-17页
第2章数据挖掘的相关技术	第17-28页
2.1 数据挖掘	第17-20页
2.1.1 数据挖掘常用的方法	第17-18页
2.1.2 数据挖掘的过程	第18-20页
2.2 聚类分析方法的概述	第20-22页
2.2.1 聚类分析对算法性能的要求	第21-22页
2.3 聚类分析中的数据类型	第22-24页
2.3.1 数据矩阵	第22页
2.3.2 聚类相似性度量	第22-24页
2.4 聚类分析中的主要算法	第24-27页
2.4.1 基于划分的聚类模型	第24页
2.4.2 基于层次的聚类模型	第24-25页
2.4.3 基于密度的聚类模型	第25-26页
2.4.4 基于网格的聚类模型	第26页
2.4.5 基于模型的聚类模型	第26-27页
2.5 本章小结	第27-28页
第3章文本聚类的相关技术	第28-37页
3.1 文本聚类预处理	第28-31页
3.1.1 分词或词根还原	第28-30页
3.1.2 停用词处理	第30页
3.1.3 特征选择	第30页
3.1.4 权重计算	第30-31页
3.2 文本表示的数学模型	第31-33页
3.2.1 布尔模型	第31页
3.2.2 概率检索模型	第31-32页
3.2.3 向量空间模型	第32-33页
3.3 文本聚类算法	第33-36页
3.3.1 层次凝聚算法	第34页
3.3.2 平面划分算法	第34页
3.3.3 k最近邻参照算法	第34-35页
3.3.4 贝叶斯算法	第35-36页
3.3.5 神经网络算法	第36页
3.4 本章小结	第36-37页
第4章基于初始权值改进的SOFM聚类算法研究	第37-53页
4.1 SOFM算法概述	第37-43页
4.1.1 SOFM算法的基本思想	第38-39页
4.1.2 SOFM聚类算法的数学描述	第39-42页
4.1.3 SOFM聚类算法的算法分析	第42-43页
4.2 现有的初始权值的选择方法	第43-44页
4.3 基于初始权值改进的SOFM聚类算法	第44-46页
4.4 仿真实验	第46-52页
4.4.1 实验语料集	第46-47页
4.4.2 预处理模块	第47-48页
4.4.3 特征表示模块	第48-49页
4.4.4 聚类算法模块	第49页
4.4.5 性能评价	第49-50页
4.4.6 实验及结果分析	第50-52页
4.5 本章小结	第52-53页
第5章基于PCA的SOFM聚类算法研究	第53-66页
5.1 文本聚类中的降维	第53-55页
5.1.1 文本聚类中降维的必要性	第53页
5.1.2 现有的文本聚类降维方法	第53-55页
5.2 基于PCA的SOFM文本聚类算法研究	第55-63页
5.2.1 主成分分析方法	第55-62页
5.2.2 基于PCA的SOFM文本聚类算法的基本思想	第62页
5.2.3 基于PCA的SOFM文本聚类算法	第62-63页
5.3 仿真实验	第63-65页
5.3.1 仿真实验模块	第63-64页
5.3.2 实验及结果分析	第64-65页
5.4 本章小结	第65-66页
结论	第66-68页
参考文献	第68-73页
攻读硕士学位期间发表的论文和取得的科研成果	第73-74页
致谢	第74页