| 摘要 | 第1-6页 |
| ABSTRACT | 第6-7页 |
| 第一章 绪论 | 第7-14页 |
| ·课题背景与意义 | 第7页 |
| ·文本聚类和文本分类 | 第7-9页 |
| ·文本聚类的研究进展 | 第9-12页 |
| ·文本聚类与模糊聚类 | 第12-13页 |
| ·本文的主要工作 | 第13-14页 |
| 第二章 中文文本的数字化模型 | 第14-21页 |
| ·向量空间模型 | 第14-15页 |
| ·特征项的选择 | 第15-16页 |
| ·特征项的获取 | 第16-18页 |
| ·汉语自动分词 | 第16-18页 |
| ·n元模型 | 第18页 |
| ·特征项的抽取 | 第18-19页 |
| ·特征项的权重计算 | 第19-21页 |
| 第三章 模糊集的基本理论 | 第21-26页 |
| ·模糊理论的发展 | 第21-22页 |
| ·模糊集的相关定义 | 第22-23页 |
| ·模糊关系矩阵的收敛定理 | 第23-26页 |
| 第四章 模糊聚类分析 | 第26-40页 |
| ·数据准备 | 第26页 |
| ·数据规格化 | 第26-27页 |
| ·模糊相似度的标定 | 第27-30页 |
| ·基于等价关系的传递闭包法 | 第30-32页 |
| ·传递闭包法的一般步骤 | 第30-31页 |
| ·传递闭包法在文本聚类中的应用研究 | 第31-32页 |
| ·基于模糊图论的最大树法 | 第32-36页 |
| ·最大树法的一般步骤 | 第32-33页 |
| ·最大树法在文本聚类中的应用研究 | 第33-36页 |
| ·最大树法与传递闭包法的比较 | 第36页 |
| ·基于划分的模糊 C-均值算法 FCM | 第36-40页 |
| ·FCM算法的一般步骤 | 第37-38页 |
| ·FCM算法在文本聚类中的应用研究 | 第38-40页 |
| 第五章 模糊C-均值算法研究 | 第40-50页 |
| ·改变数据规格化方式 | 第40-42页 |
| ·规格化方式说明 | 第40页 |
| ·实验结果及分析 | 第40-42页 |
| ·改变度量方式 | 第42-44页 |
| ·余弦距离法及其改进 | 第42-43页 |
| ·实验结果及分析 | 第43-44页 |
| ·改变初始聚类原型的选取方式 | 第44-50页 |
| ·基于微粒群优化算法的模糊 C-均值算法PSO-FCM | 第45-47页 |
| ·微粒群优化算法的基本原理 | 第45-46页 |
| ·PSO-FCM算法 | 第46-47页 |
| ·基于遗传算法的模糊 C-均值算法 GA-FCM | 第47-50页 |
| ·遗传算法的基本原理 | 第47-49页 |
| ·GA-FCM算法 | 第49-50页 |
| 第六章 基于模糊聚类的中文文本聚类原型系统的实现与实验分析 | 第50-58页 |
| ·体系结构 | 第50页 |
| ·系统实现 | 第50-51页 |
| ·功能模块 | 第51-53页 |
| ·实验测试 | 第53-58页 |
| ·数据源 | 第53页 |
| ·聚类结果评价指标 | 第53-54页 |
| ·聚类有效性 | 第53页 |
| ·查全率与查准率 | 第53-54页 |
| ·实验结果及分析 | 第54-58页 |
| ·实验一 | 第54-55页 |
| ·实验二 | 第55-58页 |
| 第七章 结束语 | 第58-59页 |
| 致谢 | 第59-60页 |
| 参考文献 | 第60-64页 |
| 附录一 读研期间发表论文情况 | 第64页 |
| 附录二 读研期间获奖情况 | 第64页 |