聚类分析中若干关键技术及其在电信领域的应用研究
| 摘要 | 第1-6页 |
| ABSTRACT | 第6-12页 |
| 第一章 绪论 | 第12-30页 |
| ·知识发现的基本概念 | 第12-14页 |
| ·数据挖掘的产生 | 第14-15页 |
| ·数据挖掘的功能 | 第15-19页 |
| ·概念/类描述 | 第16页 |
| ·分类和预测 | 第16-17页 |
| ·聚类分析 | 第17页 |
| ·频繁模式/关联规则挖掘 | 第17页 |
| ·孤立点分析 | 第17-18页 |
| ·序列分析和时序分析 | 第18-19页 |
| ·数据挖掘在电信行业的重要应用 | 第19-25页 |
| ·数据多维分析:统计与查询 | 第19页 |
| ·异常模式识别:探测电信欺诈 | 第19-20页 |
| ·聚类及分类分析:电信行业客户关系管理应用 | 第20-22页 |
| ·电信行业数据挖掘方法论 | 第22-25页 |
| ·数据挖掘系统 | 第25-26页 |
| ·Enterprlse Miner | 第25页 |
| ·clemeiltine | 第25页 |
| ·Intelligent Miner | 第25-26页 |
| ·Teradata Miner | 第26页 |
| ·Darwln | 第26页 |
| ·WEKA | 第26页 |
| ·本文创新点及组织结构 | 第26-28页 |
| ·参考文献 | 第28-30页 |
| 第二章 聚类分析算法及其应用 | 第30-50页 |
| ·聚类的基本概念 | 第30-33页 |
| ·聚类的定义 | 第30页 |
| ·聚类有效性的评价 | 第30-31页 |
| ·对聚类分析算法的典型要求 | 第31-33页 |
| ·主要聚类算法 | 第33-47页 |
| ·基于划分的方法 | 第33-35页 |
| ·基于层次的方法 | 第35-38页 |
| ·基于密度的方法 | 第38-40页 |
| ·基于网格的方法 | 第40-43页 |
| ·基于模型的方法 | 第43-47页 |
| ·本章小结 | 第47页 |
| ·参考文献 | 第47-50页 |
| 第三章 聚类中心点初始化算法 | 第50-67页 |
| ·聚类中心点初始化 | 第50-54页 |
| ·初始化中心点的必要性 | 第50页 |
| ·主要的中心点初始化算法 | 第50-54页 |
| ·基于复合近邻的聚类中心点初始化算法 | 第54-59页 |
| ·基本定义 | 第54-55页 |
| ·算法说明 | 第55-56页 |
| ·算法流程 | 第56页 |
| ·算法分析 | 第56-57页 |
| ·实验分析 | 第57-59页 |
| ·基于方向指针的聚类中心点初始化算法 | 第59-65页 |
| ·基本定义 | 第59-61页 |
| ·算法流程 | 第61-63页 |
| ·算法分析 | 第63页 |
| ·算法效果分析 | 第63-64页 |
| ·算法性能分析 | 第64-65页 |
| ·本章小结 | 第65页 |
| ·参考文献 | 第65-67页 |
| 第四章 高维数据聚类分析 | 第67-91页 |
| ·高维数据聚类方法 | 第67-70页 |
| ·高维数据 | 第67-68页 |
| ·高维数据的特点 | 第68-70页 |
| ·高维对聚类分析算法的影响 | 第70页 |
| ·子空间聚类 | 第70-75页 |
| ·可交叠子空间聚类算法 | 第71-73页 |
| ·不可交叠子空间聚类算法 | 第73-74页 |
| ·其它子空间聚类算法 | 第74-75页 |
| ·基于极大团的高维子空间聚类算法 | 第75-80页 |
| ·基于邻居的子空间簇 | 第75-76页 |
| ·基于极大团的高维子空间聚类算法 | 第76-79页 |
| ·实验分析 | 第79-80页 |
| ·采用属性聚类的高维子空间聚类算法 | 第80-86页 |
| ·问题描述 | 第81页 |
| ·过滤冗余属性 | 第81-82页 |
| ·计算关系矩阵 | 第82-83页 |
| ·属性聚类 | 第83-84页 |
| ·产生子空间簇 | 第84-85页 |
| ·实验 | 第85-86页 |
| ·本章小结 | 第86-87页 |
| ·参考文献 | 第87-91页 |
| 第五章 孤立点检测 | 第91-117页 |
| ·孤立点检测算法 | 第91-97页 |
| ·基于统计的算法 | 第92页 |
| ·基于深度的算法 | 第92页 |
| ·基于偏差的算法 | 第92页 |
| ·基于距离的算法 | 第92-95页 |
| ·基于密度的算法 | 第95-97页 |
| ·现有孤立点检测算法及其所存在的问题 | 第97-98页 |
| ·基于双半径密度差异的孤立点检测算法 | 第98-106页 |
| ·基本思想 | 第98-100页 |
| ·算法流程 | 第100-102页 |
| ·实验分析 | 第102-104页 |
| ·算法在电信行业客户流失预测中的应用 | 第104-106页 |
| ·采用距离分布聚类的孤立点检测算法 | 第106-113页 |
| ·基本定义 | 第106-109页 |
| ·算法流程 | 第109-110页 |
| ·性能分析 | 第110-113页 |
| ·本章小结 | 第113-114页 |
| ·参考文献 | 第114-117页 |
| 第六章 约束聚类 | 第117-138页 |
| ·带有约束条件的聚类问题 | 第117-125页 |
| ·背景介绍 | 第117-118页 |
| ·聚类过程中的约束条件 | 第118-121页 |
| ·约束聚类 | 第121页 |
| ·约束聚类的收益 | 第121页 |
| ·约束聚类的问题 | 第121-125页 |
| ·评价约束集合的标准 | 第125-131页 |
| ·信息度 | 第125-127页 |
| ·一致性 | 第127页 |
| ·失真 | 第127-131页 |
| ·最小化失真的约束聚类算法 | 第131-135页 |
| ·算法思路 | 第131-132页 |
| ·算法流程 | 第132-133页 |
| ·实验分析 | 第133-135页 |
| ·本章小结 | 第135页 |
| ·参考文献 | 第135-138页 |
| 第七章 聚类技术在电信行业客户关系管理中的应用 | 第138-151页 |
| ·电信账务数据的分析与挖掘 | 第138-149页 |
| ·需求分析 | 第138-139页 |
| ·数据探索 | 第139-140页 |
| ·数据准备 | 第140-142页 |
| ·建模 | 第142-146页 |
| ·模型评估 | 第146-147页 |
| ·模型应用 | 第147-149页 |
| ·本章小结 | 第149-150页 |
| ·参考文献 | 第150-151页 |
| 第八章 结束语 | 第151-155页 |
| ·论文总结 | 第151-152页 |
| ·本文的创新点 | 第152-153页 |
| ·进一步的研究工作 | 第153-155页 |
| 第九章 致谢 | 第155-156页 |
| 第十章 作者在攻读博士学位期间发表的学术论文 | 第156页 |