首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于信息论的数据挖掘算法

中文摘要第1-11页
英文摘要第11-13页
第一章 前言第13-19页
   ·模式挖掘第14页
   ·特征选择第14-15页
   ·相关聚类第15-16页
   ·数据挖掘和隐私保护第16-17页
   ·本文的主要贡献第17页
   ·本文组织第17-19页
第二章 信息距离及其应用第19-42页
   ·相关工作第20-21页
   ·信息距离第21-25页
     ·信息距离第23-25页
   ·应用一:依赖树第25-29页
     ·Chow-Liu树第25页
     ·低熵树第25-27页
     ·使用信息距离的依赖树第27-29页
   ·应用二:基于信息距离的特征选择第29-34页
     ·特征选择第29页
     ·几个相关性度量讨论第29-32页
     ·基于信息距离的特征选择方法第32页
     ·实验第32-34页
   ·应用三:相关性模式挖掘第34-41页
     ·全置信度定义第35-36页
     ·信息相关模式第36页
     ·信息相关模式挖掘算法第36-38页
     ·实验第38-41页
   ·本章小结第41-42页
第三章 熵多样性模式和非冗余交互特征子集挖掘第42-83页
   ·相关工作第43-45页
   ·预备知识第45-46页
   ·熵l-多样性模式挖掘第46-59页
     ·问题定义第46-47页
     ·熵多样性的几个性质第47-50页
     ·项集联合熵之间的几个关系第50-51页
     ·挖掘算法第51-55页
     ·熵l-多样性模式挖掘实验第55-59页
   ·非冗余多样性模式第59-72页
     ·问题定义第59-61页
     ·与多样性模式相关的性质第61页
     ·联合熵界的新讨论第61-63页
     ·对基于Hamming距离的界的改进第63-65页
     ·挖掘算法第65-67页
     ·实验第67-72页
   ·非冗余交互特征子集第72-81页
     ·问题定义第72-74页
     ·新的基于特征对相关性的界第74-76页
     ·新的基于互信息量的界第76-78页
     ·NIFS挖掘算法第78页
     ·性能评估第78-81页
   ·本章小结第81-83页
第四章 KLNCC:基于KL-Divergence的非线性相关聚类算法第83-92页
   ·相关工作第84-85页
   ·KLNCC算法第85-89页
     ·高斯混合模型第85-86页
     ·EM算法第86-87页
     ·合并微簇第87-88页
     ·时间复杂度分析第88-89页
   ·实验第89-91页
   ·本章小结第91-92页
第五章 t-相近性隐私保护第92-116页
   ·相关工作第93-95页
   ·基本模型第95-98页
   ·使用Hellinger距离的相近性第98-105页
     ·Hellinger距离的性质第98-101页
     ·使用Hellinger距离的t-相近性的性质第101页
     ·具体的泛化算法第101-102页
     ·实验第102-105页
   ·语义隐私和使用KL-divergence的相近性第105-115页
     ·语义隐私第105-107页
     ·KL-divergence的性质第107-110页
     ·使用KL-divergence的t-相近性的性质第110-111页
     ·具体的泛化算法第111-112页
     ·实验第112-115页
   ·本章小结第115-116页
第六章 总结和展望第116-118页
参考文献第118-129页
攻读博士期间完成的工作第129-131页
致谢第131-132页

论文共132页,点击 下载论文
上一篇:问题回答和对话系统中置信度的研究
下一篇:文本分类技术与应用研究