大规模文档聚类中若干关键问题的研究
摘要 | 第1-6页 |
Abstract | 第6-13页 |
第1章 绪论 | 第13-28页 |
·课题背景及研究的目的和意义 | 第13页 |
·大规模文档聚类的研究现状 | 第13-22页 |
·大规模文档聚类与传统文档聚类的共性 | 第14-18页 |
·大规模文档聚类与传统文档聚类的区分性 | 第18页 |
·大规模文档聚类算法分析 | 第18-22页 |
·自组织映射聚类 | 第22-24页 |
·本文的研究内容及主要创新点 | 第24-26页 |
·本文的内容安排 | 第26-28页 |
第2章 基于词汇链的文档特征选择 | 第28-42页 |
·引言 | 第28-29页 |
·词义获取 | 第29-32页 |
·词汇链构建 | 第32-34页 |
·文档特征词选择 | 第34-36页 |
·时间复杂度分析 | 第36-37页 |
·实验及分析 | 第37-41页 |
·本章小结 | 第41-42页 |
第3章 大规模文档聚类中相似度计算的改进方法 | 第42-60页 |
·引言 | 第42-43页 |
·基于语义的相似度计算方法 | 第43-52页 |
·特征词相似度计算 | 第43-44页 |
·类别初始划分 | 第44-45页 |
·自组织训练阶段 | 第45-49页 |
·实验及分析 | 第49-52页 |
·基于特征权值的相似度计算方法 | 第52-59页 |
·特征权值量化 | 第52-54页 |
·特征权值在相似度计算中的应用 | 第54-55页 |
·实验及分析 | 第55-59页 |
·本章小结 | 第59-60页 |
第4章 大规模文档聚类中类别特征集合的构造方法 | 第60-82页 |
·引言 | 第60-61页 |
·基于向量压缩的类别特征集合构造方法 | 第61-73页 |
·算法初始化 | 第62-65页 |
·类别特征集合调整 | 第65-66页 |
·神经元内聚度及区分度分析 | 第66-69页 |
·实验及分析 | 第69-73页 |
·基于概率的多阶段类别特征集合构造方法 | 第73-80页 |
·类别特征集合的构造方法 | 第74-78页 |
·算法的改进方法 | 第78-79页 |
·实验及分析 | 第79-80页 |
·本章小结 | 第80-82页 |
第5章 大规模文档的动态聚类技术 | 第82-109页 |
·引言 | 第82-83页 |
·基于抽样数据的增量聚类算法 | 第83-90页 |
·原始数据聚类技术 | 第84页 |
·抽样数据选择 | 第84-86页 |
·实验及分析 | 第86-90页 |
·拓扑结构可变的神经元聚类算法 | 第90-108页 |
·SOM聚类算法分析 | 第91-94页 |
·拓扑结构可变的神经元聚类算法(TASOM) | 第94-104页 |
·基于TASOM的数据进化分析 | 第104-105页 |
·实验及分析 | 第105-108页 |
·本章小结 | 第108-109页 |
结论 | 第109-111页 |
参考文献 | 第111-123页 |
攻读学位期间发表的论文 | 第123-125页 |
致谢 | 第125-126页 |
个人简历 | 第126页 |