摘要 | 第1-6页 |
ABSTRACT | 第6-7页 |
第一章 绪论 | 第7-14页 |
·课题背景与意义 | 第7页 |
·文本聚类和文本分类 | 第7-9页 |
·文本聚类的研究进展 | 第9-12页 |
·文本聚类与模糊聚类 | 第12-13页 |
·本文的主要工作 | 第13-14页 |
第二章 中文文本的数字化模型 | 第14-21页 |
·向量空间模型 | 第14-15页 |
·特征项的选择 | 第15-16页 |
·特征项的获取 | 第16-18页 |
·汉语自动分词 | 第16-18页 |
·n元模型 | 第18页 |
·特征项的抽取 | 第18-19页 |
·特征项的权重计算 | 第19-21页 |
第三章 模糊集的基本理论 | 第21-26页 |
·模糊理论的发展 | 第21-22页 |
·模糊集的相关定义 | 第22-23页 |
·模糊关系矩阵的收敛定理 | 第23-26页 |
第四章 模糊聚类分析 | 第26-40页 |
·数据准备 | 第26页 |
·数据规格化 | 第26-27页 |
·模糊相似度的标定 | 第27-30页 |
·基于等价关系的传递闭包法 | 第30-32页 |
·传递闭包法的一般步骤 | 第30-31页 |
·传递闭包法在文本聚类中的应用研究 | 第31-32页 |
·基于模糊图论的最大树法 | 第32-36页 |
·最大树法的一般步骤 | 第32-33页 |
·最大树法在文本聚类中的应用研究 | 第33-36页 |
·最大树法与传递闭包法的比较 | 第36页 |
·基于划分的模糊 C-均值算法 FCM | 第36-40页 |
·FCM算法的一般步骤 | 第37-38页 |
·FCM算法在文本聚类中的应用研究 | 第38-40页 |
第五章 模糊C-均值算法研究 | 第40-50页 |
·改变数据规格化方式 | 第40-42页 |
·规格化方式说明 | 第40页 |
·实验结果及分析 | 第40-42页 |
·改变度量方式 | 第42-44页 |
·余弦距离法及其改进 | 第42-43页 |
·实验结果及分析 | 第43-44页 |
·改变初始聚类原型的选取方式 | 第44-50页 |
·基于微粒群优化算法的模糊 C-均值算法PSO-FCM | 第45-47页 |
·微粒群优化算法的基本原理 | 第45-46页 |
·PSO-FCM算法 | 第46-47页 |
·基于遗传算法的模糊 C-均值算法 GA-FCM | 第47-50页 |
·遗传算法的基本原理 | 第47-49页 |
·GA-FCM算法 | 第49-50页 |
第六章 基于模糊聚类的中文文本聚类原型系统的实现与实验分析 | 第50-58页 |
·体系结构 | 第50页 |
·系统实现 | 第50-51页 |
·功能模块 | 第51-53页 |
·实验测试 | 第53-58页 |
·数据源 | 第53页 |
·聚类结果评价指标 | 第53-54页 |
·聚类有效性 | 第53页 |
·查全率与查准率 | 第53-54页 |
·实验结果及分析 | 第54-58页 |
·实验一 | 第54-55页 |
·实验二 | 第55-58页 |
第七章 结束语 | 第58-59页 |
致谢 | 第59-60页 |
参考文献 | 第60-64页 |
附录一 读研期间发表论文情况 | 第64页 |
附录二 读研期间获奖情况 | 第64页 |