中文文本聚类的评价与改进研究
| 摘要 | 第1-6页 |
| ABSTRACT | 第6-10页 |
| 第1章 绪论 | 第10-16页 |
| ·课题研究的背景 | 第10-11页 |
| ·课题研究的现状 | 第11-12页 |
| ·课题的主要研究目的和意义 | 第12-13页 |
| ·本文的研究内容 | 第13-14页 |
| ·本文的组织 | 第14-16页 |
| 第2章 文本聚类效果影响因素 | 第16-28页 |
| ·文本聚类概述 | 第16-18页 |
| ·文本表示模型 | 第18-22页 |
| ·布尔模型 | 第18-19页 |
| ·向量空间模型 | 第19-20页 |
| ·概率模型 | 第20-21页 |
| ·语言模型 | 第21-22页 |
| ·文本相似度计算 | 第22-24页 |
| ·样本间相似度 | 第22-23页 |
| ·簇间相似度 | 第23-24页 |
| ·文本聚类算法 | 第24-27页 |
| ·基于划分的方法 | 第24页 |
| ·基于层次的方法 | 第24-25页 |
| ·基于密度的方法 | 第25-26页 |
| ·基于网格的方法 | 第26页 |
| ·基于模型的方法 | 第26-27页 |
| ·本章小结 | 第27-28页 |
| 第3章 基于吻合度的文本聚类评价方法 | 第28-43页 |
| ·文本聚类评价方法回顾 | 第28-32页 |
| ·聚类评价方法概述 | 第28-29页 |
| ·基于人工标准的指标 | 第29-32页 |
| ·基于目标函数的指标 | 第32页 |
| ·基于吻合度的文本聚类评价方法 | 第32-42页 |
| ·评价模型的提出 | 第33-34页 |
| ·吻合度计算 | 第34页 |
| ·算法描述 | 第34-35页 |
| ·聚类与分类实验方法介绍 | 第35-38页 |
| ·实验结果与分析 | 第38-42页 |
| ·本章小结 | 第42-43页 |
| 第4章 基于迭代分类的聚类结果改进方法 | 第43-59页 |
| ·方法的提出 | 第43-44页 |
| ·初始聚类方法 | 第44-47页 |
| ·k-means 方法概述 | 第44-46页 |
| ·凝聚层次聚类算法概述 | 第46-47页 |
| ·迭代分类方法 | 第47-48页 |
| ·聚类结果改进算法描述 | 第48-50页 |
| ·实验结果与分析 | 第50-57页 |
| ·数据聚类改进实验 | 第50-55页 |
| ·文本聚类改进实验 | 第55-57页 |
| ·本章小结 | 第57-59页 |
| 第5章 总结与工作展望 | 第59-61页 |
| ·本文的主要研究工作及成果 | 第59-60页 |
| ·存在的问题及对未来工作的展望 | 第60-61页 |
| 致谢 | 第61-62页 |
| 参考文献 | 第62-66页 |
| 附录 | 第66-70页 |