中文文本聚类的评价与改进研究
摘要 | 第1-6页 |
ABSTRACT | 第6-10页 |
第1章 绪论 | 第10-16页 |
·课题研究的背景 | 第10-11页 |
·课题研究的现状 | 第11-12页 |
·课题的主要研究目的和意义 | 第12-13页 |
·本文的研究内容 | 第13-14页 |
·本文的组织 | 第14-16页 |
第2章 文本聚类效果影响因素 | 第16-28页 |
·文本聚类概述 | 第16-18页 |
·文本表示模型 | 第18-22页 |
·布尔模型 | 第18-19页 |
·向量空间模型 | 第19-20页 |
·概率模型 | 第20-21页 |
·语言模型 | 第21-22页 |
·文本相似度计算 | 第22-24页 |
·样本间相似度 | 第22-23页 |
·簇间相似度 | 第23-24页 |
·文本聚类算法 | 第24-27页 |
·基于划分的方法 | 第24页 |
·基于层次的方法 | 第24-25页 |
·基于密度的方法 | 第25-26页 |
·基于网格的方法 | 第26页 |
·基于模型的方法 | 第26-27页 |
·本章小结 | 第27-28页 |
第3章 基于吻合度的文本聚类评价方法 | 第28-43页 |
·文本聚类评价方法回顾 | 第28-32页 |
·聚类评价方法概述 | 第28-29页 |
·基于人工标准的指标 | 第29-32页 |
·基于目标函数的指标 | 第32页 |
·基于吻合度的文本聚类评价方法 | 第32-42页 |
·评价模型的提出 | 第33-34页 |
·吻合度计算 | 第34页 |
·算法描述 | 第34-35页 |
·聚类与分类实验方法介绍 | 第35-38页 |
·实验结果与分析 | 第38-42页 |
·本章小结 | 第42-43页 |
第4章 基于迭代分类的聚类结果改进方法 | 第43-59页 |
·方法的提出 | 第43-44页 |
·初始聚类方法 | 第44-47页 |
·k-means 方法概述 | 第44-46页 |
·凝聚层次聚类算法概述 | 第46-47页 |
·迭代分类方法 | 第47-48页 |
·聚类结果改进算法描述 | 第48-50页 |
·实验结果与分析 | 第50-57页 |
·数据聚类改进实验 | 第50-55页 |
·文本聚类改进实验 | 第55-57页 |
·本章小结 | 第57-59页 |
第5章 总结与工作展望 | 第59-61页 |
·本文的主要研究工作及成果 | 第59-60页 |
·存在的问题及对未来工作的展望 | 第60-61页 |
致谢 | 第61-62页 |
参考文献 | 第62-66页 |
附录 | 第66-70页 |