一种中文文本聚类方法的研究
第1章 绪论 | 第1-33页 |
·聚类研究概述 | 第23-27页 |
·引言 | 第23-24页 |
·聚类的研究现状和发展趋势 | 第24-27页 |
·文本聚类研究进展 | 第27-31页 |
·本文研究内容 | 第31-33页 |
第2章 中文文本聚类模型 | 第33-40页 |
·聚类模型 | 第33-34页 |
·中文文档的表示 | 第34页 |
·文档分词和预处理 | 第34-37页 |
·文档特征的提取 | 第37-38页 |
·文档特征权值调整 | 第38-39页 |
·聚类 | 第39-40页 |
第3章 中文文本聚类算法 | 第40-62页 |
·EK文本聚类算法 | 第40-49页 |
·已有的初始中心选取方法 | 第41-42页 |
·选择初始中心的思路 | 第42-43页 |
·新的初始中心选取算法 | 第43-45页 |
·EK文本聚类算法 | 第45-46页 |
·实验结果与分析 | 第46-49页 |
·特征提取得到的特征数目对聚类的影响 | 第46-48页 |
·文档特征权值调整 | 第48-49页 |
·DBTC文本聚类算法 | 第49-61页 |
·DBTC文本聚类算法 | 第50-57页 |
·实验及结果分析 | 第57-61页 |
·DBTC用于文档聚类的可行性实验 | 第58页 |
·DBTC与DBSCAN时间复杂性的比较实验 | 第58-59页 |
·参数对DBTC影响的实验 | 第59-61页 |
·小结 | 第61-62页 |
第4章 文本聚类的应用 | 第62-68页 |
·电子邮件分类和过滤系统ECFS | 第63-67页 |
·模拟实验 | 第67页 |
·小结 | 第67-68页 |
总结与展望 | 第68-69页 |
参考文献 | 第69-75页 |
攻读硕士期间公开发表的论文 | 第75-76页 |
致谢 | 第76页 |