聚类/分类理论研究及其在文本挖掘中的应用
| 独创性声明 | 第1页 |
| 关于论文使用授权的说明 | 第2-3页 |
| 致谢 | 第3-5页 |
| 摘要 | 第5-7页 |
| ABSTRACT | 第7-12页 |
| 第一章 引言 | 第12-20页 |
| ·我们所期待的信息服务 | 第12-15页 |
| ·聚类,分类的帮助 | 第15-17页 |
| ·本文的组织 | 第17-20页 |
| 第二章 聚类/分类算法概述 | 第20-40页 |
| ·样本类型和相似性测度 | 第20-24页 |
| ·样本类型 | 第20-21页 |
| ·相似性测度 | 第21-24页 |
| ·聚类算法介绍 | 第24-34页 |
| ·聚类三步曲 | 第24-26页 |
| ·几种常用的聚类策略 | 第26-27页 |
| ·类的定义 | 第27-28页 |
| ·聚类谱系图 | 第28-29页 |
| ·系统聚类法 | 第29-33页 |
| ·动态聚类法 | 第33-34页 |
| ·分类算法介绍 | 第34-40页 |
| ·判别分析 | 第35-37页 |
| ·机器学习的思路 | 第37-38页 |
| ·神经网络 | 第38-40页 |
| 第三章 聚类/分类中的粒度原理 | 第40-54页 |
| ·聚类中的粒度原理 | 第40-44页 |
| ·信息粒度 | 第42页 |
| ·信息粒度的形式化描述 | 第42-43页 |
| ·不同粒度世界的关系 | 第43-44页 |
| ·分类中的粒度原理 | 第44-48页 |
| ·聚类结果和先验知识的不协调 | 第45-46页 |
| ·从粒度的角度理解不协凋性 | 第46-48页 |
| ·统一在粒度框架下的聚类和分类 | 第48-50页 |
| ·基于信息粒度原理的分类算法 | 第50页 |
| ·实验结果 | 第50-52页 |
| ·数据分析和小结 | 第52-54页 |
| 第四章 基于拓扑结构的聚类算法 | 第54-66页 |
| ·拓扑结构和化学键 | 第54-57页 |
| ·拟物的思路 | 第57-61页 |
| ·引力场模型 | 第58-59页 |
| ·等势线圈的拓扑结构和聚类谱系图 | 第59-61页 |
| ·拓扑结构的计算 | 第61-63页 |
| ·实验结果和不足之处 | 第63-66页 |
| 第五章 基于描述复杂性的聚类算法 | 第66-82页 |
| ·最小描述长度原理 | 第67-69页 |
| ·“规则+例外”的描述方法 | 第69-76页 |
| ·认知心理学的启示 | 第69-74页 |
| ·概念结构 | 第69-71页 |
| ·概念形成 | 第71-74页 |
| ·机器学习的启示 | 第74-75页 |
| ·描述方法的形式化表述 | 第75-76页 |
| ·优化技术介绍 | 第76-79页 |
| ·邻域的定义和启发式策略 | 第79-80页 |
| ·实验结果 | 第80-82页 |
| 第六章 文本聚类中权重计算的对偶性策略 | 第82-100页 |
| ·文本的表示 | 第82-86页 |
| ·务实的统计路线 | 第82-84页 |
| ·文本的形式化表示 | 第84-86页 |
| ·特征项的选择 | 第86-87页 |
| ·权重计算的对偶性策略 | 第87-93页 |
| ·概念空间 | 第93-95页 |
| ·概念空间在文本聚类中的应用 | 第95-96页 |
| ·概念空间在文本摘要中的应用 | 第96页 |
| ·小结 | 第96-100页 |
| 第七章 总结和对未来工作的展望 | 第100-103页 |
| ·本文的贡献 | 第100-101页 |
| ·进一步研究的方向 | 第101-103页 |
| 参考文献 | 第103-108页 |
| 作者简历及发表论文 | 第108-109页 |