基于特征加权的半监督文本聚类研究
| 摘要 | 第1-4页 |
| ABSTRACT | 第4-8页 |
| 1 引言 | 第8-13页 |
| ·研究背景 | 第8-9页 |
| ·研究现状与研究意义 | 第9-11页 |
| ·论文的工作和创新点 | 第11页 |
| ·论文组织 | 第11-13页 |
| 2 半监督聚类理论基础 | 第13-24页 |
| ·常用聚类算法介绍 | 第13-19页 |
| ·基于划分的方法 | 第13-15页 |
| ·基于层次的方法 | 第15-16页 |
| ·自组织映射 | 第16-18页 |
| ·基于密度的方法 | 第18页 |
| ·其他聚类方法 | 第18-19页 |
| ·特征选择指标 | 第19-21页 |
| ·GINI 指标 | 第19页 |
| ·χ~ 2 统计量 | 第19-20页 |
| ·信息增益 | 第20-21页 |
| ·互信息 | 第21页 |
| ·评价指标 | 第21-24页 |
| ·微平均和宏平均 | 第21-22页 |
| ·归一化互信息 | 第22-23页 |
| ·RAND 指标 | 第23-24页 |
| 3 优化的特征加权半监督聚类 | 第24-34页 |
| ·半监督聚类算法 | 第24-29页 |
| ·基于搜索的半监督聚类 | 第24-27页 |
| ·基于相似度的半监督聚类 | 第27-28页 |
| ·基于搜索和相似度相结合的半监督聚类 | 第28-29页 |
| ·基于特征加权的半监督聚类算法 | 第29-32页 |
| ·计算复杂性 | 第32-34页 |
| 4 实验设计和分析 | 第34-43页 |
| ·实验设计 | 第34页 |
| ·实验环境 | 第34页 |
| ·实验数据集 | 第34-36页 |
| ·实验结果及分析 | 第36-43页 |
| ·参数选择实验 | 第37-39页 |
| ·对比实验 | 第39-43页 |
| 5 总结与展望 | 第43-45页 |
| ·总结 | 第43页 |
| ·未来工作 | 第43-45页 |
| 参考文献 | 第45-49页 |
| 简历 | 第49-50页 |
| 致谢 | 第50页 |