第一章 引言 | 第1-28页 |
·关联规则挖掘 | 第14-20页 |
·关联规则挖掘的含义 | 第14-15页 |
·关联规则挖掘的主要算法分析 | 第15-19页 |
·快速、启发式搜索策略 | 第16-18页 |
·分布、并行策略 | 第18页 |
·取样策略 | 第18-19页 |
·关联规则挖掘目前存在的问题和挑战 | 第19-20页 |
·解决关联规则挖掘取样复杂性的两类方法分析 | 第20-25页 |
·自适应、在线取样策略 | 第20-22页 |
·取样复杂性的理论估计 | 第22-25页 |
·取样复杂性的PAC 理论估计 | 第22-24页 |
·取样复杂性的PAGA 理论估计 | 第24-25页 |
·本文的主要研究工作和贡献 | 第25-27页 |
·本文的主要研究内容 | 第25-26页 |
·本文的主要贡献 | 第26-27页 |
·论文的组织结构 | 第27-28页 |
第二章 取样误差量化模型及其快速估计算法 | 第28-44页 |
·基本的取样误差量化方法和快速估计算法 | 第28-33页 |
·不考虑计算开销的取样误差量化方法 | 第29-30页 |
·考虑计算开销的取样误差量化方法 | 第30-33页 |
·水平选取低层频繁项集的方法 | 第30-31页 |
·垂直选取频繁项集部分超类的方法 | 第31-33页 |
·取样误差量化三元组模型和主误差区间估计法 | 第33-36页 |
·取样误差量化三元组模型 | 第33-34页 |
·主误差的区间估计法及其理论分析 | 第34-36页 |
·实验结果及分析 | 第36-42页 |
·小结 | 第42-44页 |
第三章 自适应、在线多尺度取样定理和取样算法 | 第44-56页 |
·渐近取样算法PSAR 简介 | 第44-46页 |
·多尺度取样方法的基本原理 | 第46-47页 |
·多分辨分析(MRA) | 第46页 |
·Shannon 取样定理 | 第46-47页 |
·关联规则挖掘的多尺度取样定理 | 第47-49页 |
·一致平移多尺度取样定理 | 第47-48页 |
·非一致平移多尺度取样定理 | 第48-49页 |
·关联规则挖掘的多尺度取样算法MSAR | 第49-51页 |
·实验结果及分析 | 第51-53页 |
·小结 | 第53-56页 |
第四章 关联规则挖掘的取样集成模型和理论 | 第56-74页 |
·关联规则挖掘的取样集成模型 | 第56-57页 |
·基本原理 | 第56-57页 |
·基于Bagging 策略的取样集成模型SEM | 第57页 |
·取样集成模型的理论分析 | 第57-63页 |
·取样集成有效性的Monte Carlo 解释 | 第58-60页 |
·取样集成误差的Bias-variance 分解 | 第60-63页 |
·取样集成模型的快速投票算法 | 第63-65页 |
·自适应、在线取样集成算法 | 第65-66页 |
·实验结果及分析 | 第66-73页 |
·取样集成模型有效性的测试和分析 | 第66-68页 |
·自适应、在线取样集成算法的测试和分析 | 第68-73页 |
·小结 | 第73-74页 |
第五章 关联规则挖掘取样复杂性的PAC理论分析 | 第74-96页 |
·关联规则挖掘PAC 方法的本质和最优取样复杂性 | 第74-85页 |
·基本知识 | 第74-77页 |
·关联规则挖掘PAC 方法的本质 | 第77-78页 |
·最坏情形分析下的最优取样复杂性 | 第78-82页 |
·最优取样界的过估计检验 | 第82-85页 |
·双参数限制PAC-SC 框架下的取样复杂性 | 第85-90页 |
·问题陈述 | 第85-86页 |
·双参数限制PAC-SC 框架下的取样界估计 | 第86-89页 |
·对比PAC-SC 与PAGA | 第89-90页 |
·主误差限制PAC-FM 框架下的取样复杂性 | 第90-92页 |
·问题陈述 | 第90-91页 |
·主误差限制PAC-FM 框架下的取样界估计 | 第91-92页 |
·平均情形分析下的取样复杂性 | 第92-93页 |
·问题陈述 | 第92-93页 |
·平均情形分析下的取样复杂性难点解析 | 第93页 |
·小结 | 第93-96页 |
第六章 解决取样复杂性方法的对比和取样复杂性理论的应用 | 第96-104页 |
·解决关联规则挖掘取样复杂性方法的对比 | 第96-99页 |
·自适应取样方法 | 第96-97页 |
·自适应取样集成方法 | 第97-98页 |
·取样复杂性的PAC 理论估计方法 | 第98-99页 |
·关联规则挖掘取样复杂性理论的简单应用 | 第99-102页 |
·基于阈值松驰定理的分布式关联规则挖掘方法 | 第99-100页 |
·基于取样集成模型的高精确性流数据关联规则挖掘方法 | 第100-102页 |
·小结 | 第102-104页 |
第七章 结束语 | 第104-108页 |
·本文主要贡献与创新 | 第104-106页 |
·取样误差量化方法和快速估计算法 | 第104页 |
·多尺度取样定理和取样算法 | 第104-105页 |
·取样集成模型和理论 | 第105页 |
·取样复杂性的PAC 理论推广 | 第105页 |
·取样复杂性理论的新应用 | 第105-106页 |
·下一步研究工作 | 第106-108页 |
·与取样复杂性有关的新观点 | 第106页 |
·存在的问题和下一步工作重点 | 第106-108页 |
参考文献 | 第108-118页 |
致谢 | 第118-119页 |
作者简历及论文发表情况 | 第119-120页 |