聚类/分类理论研究及其在文本挖掘中的应用
独创性声明 | 第1页 |
关于论文使用授权的说明 | 第2-3页 |
致谢 | 第3-5页 |
摘要 | 第5-7页 |
ABSTRACT | 第7-12页 |
第一章 引言 | 第12-20页 |
·我们所期待的信息服务 | 第12-15页 |
·聚类,分类的帮助 | 第15-17页 |
·本文的组织 | 第17-20页 |
第二章 聚类/分类算法概述 | 第20-40页 |
·样本类型和相似性测度 | 第20-24页 |
·样本类型 | 第20-21页 |
·相似性测度 | 第21-24页 |
·聚类算法介绍 | 第24-34页 |
·聚类三步曲 | 第24-26页 |
·几种常用的聚类策略 | 第26-27页 |
·类的定义 | 第27-28页 |
·聚类谱系图 | 第28-29页 |
·系统聚类法 | 第29-33页 |
·动态聚类法 | 第33-34页 |
·分类算法介绍 | 第34-40页 |
·判别分析 | 第35-37页 |
·机器学习的思路 | 第37-38页 |
·神经网络 | 第38-40页 |
第三章 聚类/分类中的粒度原理 | 第40-54页 |
·聚类中的粒度原理 | 第40-44页 |
·信息粒度 | 第42页 |
·信息粒度的形式化描述 | 第42-43页 |
·不同粒度世界的关系 | 第43-44页 |
·分类中的粒度原理 | 第44-48页 |
·聚类结果和先验知识的不协调 | 第45-46页 |
·从粒度的角度理解不协凋性 | 第46-48页 |
·统一在粒度框架下的聚类和分类 | 第48-50页 |
·基于信息粒度原理的分类算法 | 第50页 |
·实验结果 | 第50-52页 |
·数据分析和小结 | 第52-54页 |
第四章 基于拓扑结构的聚类算法 | 第54-66页 |
·拓扑结构和化学键 | 第54-57页 |
·拟物的思路 | 第57-61页 |
·引力场模型 | 第58-59页 |
·等势线圈的拓扑结构和聚类谱系图 | 第59-61页 |
·拓扑结构的计算 | 第61-63页 |
·实验结果和不足之处 | 第63-66页 |
第五章 基于描述复杂性的聚类算法 | 第66-82页 |
·最小描述长度原理 | 第67-69页 |
·“规则+例外”的描述方法 | 第69-76页 |
·认知心理学的启示 | 第69-74页 |
·概念结构 | 第69-71页 |
·概念形成 | 第71-74页 |
·机器学习的启示 | 第74-75页 |
·描述方法的形式化表述 | 第75-76页 |
·优化技术介绍 | 第76-79页 |
·邻域的定义和启发式策略 | 第79-80页 |
·实验结果 | 第80-82页 |
第六章 文本聚类中权重计算的对偶性策略 | 第82-100页 |
·文本的表示 | 第82-86页 |
·务实的统计路线 | 第82-84页 |
·文本的形式化表示 | 第84-86页 |
·特征项的选择 | 第86-87页 |
·权重计算的对偶性策略 | 第87-93页 |
·概念空间 | 第93-95页 |
·概念空间在文本聚类中的应用 | 第95-96页 |
·概念空间在文本摘要中的应用 | 第96页 |
·小结 | 第96-100页 |
第七章 总结和对未来工作的展望 | 第100-103页 |
·本文的贡献 | 第100-101页 |
·进一步研究的方向 | 第101-103页 |
参考文献 | 第103-108页 |
作者简历及发表论文 | 第108-109页 |