首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

频繁项集与高可用项集挖掘算法及其性能研究

摘要第12-14页
ABSTRACT第14-15页
第一章 引言第16-24页
    1.1 项集:数据挖掘研究领域的焦点之一第17-19页
    1.2 频繁及高可用项集挖掘问题的研究现状第19-22页
    1.3 本论文主要内容与组织结构第22-24页
第二章 频繁项集挖掘问题第24-40页
    2.1 概述第24-27页
        2.1.1 问题形式化定义第24-26页
        2.1.2 搜索空间与方法第26-27页
    2.2 基础频繁项集挖掘算法介绍第27-32页
        2.2.1 经典的候选生成Apriori算法第27-28页
        2.2.2 以垂直视角处理数据库的Eclat算法第28-29页
        2.2.3 基于前缀树结构的FP-growth算法第29-32页
    2.3 性能测试的软硬件环境第32-36页
        2.3.1 数据库描述第32-33页
        2.3.2 参照算法介绍第33-36页
        2.3.3 其他软硬件设施第36页
    2.4 实验一:三种基础算法的性能测试第36-40页
        2.4.1 实验结果第36-37页
        2.4.2 性能评价第37-40页
第三章 BFP-growth:一种快速的模式增长算法第40-55页
    3.1 经典模式增长算法的性能分析第40-42页
        3.1.1 影响FP-growth性能的三个因素第40-41页
        3.1.2 ICDM最佳算法:FPgrowth~*第41-42页
    3.2 批量模式增长算法:BFP-growth第42-48页
        3.2.1 性能提升的途径第43-44页
        3.2.2 核心步骤:两次前缀树遍历第44-47页
        3.2.3 算法伪代码第47-48页
    3.3 BFP-growth算法的性能分析第48-51页
        3.3.1 更少的遍历花费第48-49页
        3.3.2 FP-array技术应该集成在BFP-growth中吗第49-50页
        3.3.3 无修饰的前缀树结构第50-51页
    3.4 实验二:BFP-growth的性能测试及讨论第51-54页
        3.4.1 BFP-growth及FPgrowth~*与基础算法的对比第51-52页
        3.4.2 实验结果讨论第52-54页
    3.5 小结第54-55页
第四章 基于结点集合结构的NS算法第55-68页
    4.1 Eclat及FP-growth算法的优缺点第55-57页
    4.2 结点集合结构(Node-set)第57-60页
        4.2.1 条件结点第57-58页
        4.2.2 结点拓扑序号第58-59页
        4.2.3 使用结点集合结构表示前缀树第59-60页
    4.3 NS算法第60-65页
        4.3.1 映射前缀树到结点集合结构第60-62页
        4.3.2 从结点集合结构中挖掘频繁项集第62-64页
        4.3.3 一个例子第64页
        4.3.4 NS算法的原子操作第64-65页
    4.4 实验三:NS算法与其他快速挖掘算法的性能对比第65-67页
        4.4.1 实验结果第65-66页
        4.4.2 结果讨论:NS算法的性能优势第66-67页
    4.5 小结第67-68页
第五章 频繁项集挖掘算法的内存耗费第68-71页
    5.1 BFP-growth算法内存使用情况分析第68页
    5.2 NS算法内存使用情况分析第68-70页
    5.3 实验四:快速挖掘算法的内存耗费第70-71页
第六章 高可用项集挖掘问题第71-77页
    6.1 从频繁项集到高可用项集第71-72页
    6.2 问题的形式化定义第72-73页
    6.3 已有挖掘算法概述第73-77页
第七章 非候选生成的高可用项集挖掘算法第77-95页
    7.1 项集有用性列表结构第77-82页
        7.1.1 初始有用性列表第78-79页
        7.1.2 2-项集的有用性列表第79-80页
        7.1.3 k-项集有用性列表(k≥3)第80-82页
    7.2 HUI-Miner算法第82-85页
        7.2.1 剪枝策略第82-84页
        7.2.2 算法伪代码第84-85页
    7.3 HUI-Miner算法的实现细节第85-87页
        7.3.1 有用性列表表头第85-86页
        7.3.2 重新标注tid第86页
        7.3.3 交易权重有用性增加的顺序第86-87页
    7.4 实验五:HUI-Miner性能测试第87-94页
        7.4.1 实验设置第87-88页
        7.4.2 HUI-Miner及对比算法的运行时间第88-90页
        7.4.3 HUI-Miner及对比算法的内存耗费第90-91页
        7.4.4 项处理顺序对HUI-Miner性能的影响第91-92页
        7.4.5 可扩展性第92页
        7.4.6 实验结果讨论第92-94页
    7.5 小结第94-95页
第八章 从候选集合中快速识别高可用项集第95-111页
    8.1 先前算法的性能瓶颈第95-96页
    8.2 基本识别算法(BIA)第96-99页
    8.3 基于候选树的快速识别算法(FIA)第99-102页
        8.3.1 候选树结构第99-100页
        8.3.2 快速识别算法第100-102页
    8.4 算法分析:BIA与FIA第102-104页
    8.5 实验六:BIA与FIA的性能对比第104-107页
        8.5.1 高可用项集识别时间第105页
        8.5.2 候选项集生成时间第105页
        8.5.3 内存耗费第105-106页
        8.5.4 实验结果分析第106-107页
    8.6 实验七:FIA-UP-Growth+和HUI-Miner的性能对比第107-110页
        8.6.1 运行时间&内存耗费第108-109页
        8.6.2 实验结果分析第109-110页
    8.7 小结第110-111页
第九章 总结与展望第111-113页
参考文献第113-126页
攻博期间研究经历和科研成果第126-127页
致谢第127页

论文共127页,点击 下载论文
上一篇:城区复杂场景高分辨率SAR层析成像研究
下一篇:基于相机遗留痕迹检测的数字图像来源识别