首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

数据流频繁项算法性能提升的理论分析和算法研究

摘要第1-4页
Abstract第4-9页
第1章 引言第9-15页
   ·数据挖掘与数据流第9-11页
   ·数据流中的频繁项第11-14页
     ·符号及其含义第12页
     ·问题模型第12-14页
   ·研究内容及主要贡献第14-15页
第2章 相关工作第15-23页
   ·数据流频繁项算法分类第15-18页
     ·基于采样操作(Sampling-based)第15-16页
     ·基于哈希映射操作(Hashing-based)第16-17页
     ·基于计数操作(Counting-based)第17-18页
   ·层次数据流相关研究第18页
   ·正性错误与负性错误第18-19页
   ·典型算法举例第19-23页
     ·Probabilistic InPlace第19-20页
     ·Group Test第20页
     ·Count Sketch第20-21页
     ·Frequent第21页
     ·Space Saving第21-23页
第3章 频繁项算法的误差边界第23-41页
   ·Space Saving 回顾第23-28页
     ·zip-f 分布第23页
     ·数据结构与算法逻辑第23-25页
     ·重要性质第25-27页
     ·性能第27-28页
   ·提升分析第28-36页
     ·误差下界第28页
     ·求解误差上界的更精确方法第28-31页
     ·最小计数器组与严格上界第31-33页
     ·严格上界的效率第33-36页
   ·奢侈的解决方案第36-40页
     ·方案描述第36-39页
     ·实验第39-40页
   ·本章小结第40-41页
第4章 调整误差上界的新方法第41-74页
   ·引子:层次信息的作用第41-45页
   ·单计数器模型第45-51页
     ·模型描述第45-46页
     ·参数优化第46-49页
     ·模拟优化实验第49-50页
     ·放松条件的单计数器模型第50-51页
   ·完备模型第51-62页
     ·观察数据流的另一个视角第51-54页
     ·模型描述第54-56页
     ·性质第56-58页
     ·完备模型下的SS_Random_r 合理性第58-62页
   ·末BUCKET 生命周期策略第62-67页
     ·策略描述第62-64页
     ·参数优化第64-67页
   ·末BUCKET 计数器策略第67-71页
     ·策略描述第67-68页
     ·参数转换第68-69页
     ·误差分析第69页
     ·变化边界的末BUCKET 计数器策略第69-71页
   ·思考第71-73页
     ·误差上界的增长速度第71-72页
     ·算法参数与误差保证第72-73页
   ·本章小结第73-74页
第5章 实验第74-87页
   ·算法性能评价标准第74-76页
   ·人工数据生成器第76-77页
   ·宏观对比第77-80页
     ·频繁项查询第77-79页
     ·top-k 查询第79-80页
   ·微观对比第80-86页
     ·排序偏差第80-82页
     ·频率偏差第82-84页
     ·top-k 准确率曲线第84-85页
     ·最大可能误差第85页
     ·微观指标与计数器替换次数的关系第85-86页
   ·本章小结第86-87页
第6章 对时间敏感数据流的处理第87-90页
   ·时间权重第87-88页
   ·权重的约束条件第88-90页
第7章 结论第90-93页
   ·研究工作总结第90-91页
   ·进一步工作第91-93页
参考文献第93-96页
致谢第96-97页
个人简历、在学期间发表的学术论文与研究成果第97页

论文共97页,点击 下载论文
上一篇:基于本体的Web服务测试生成与变异测试研究
下一篇:制造现场员工调度管理信息系统的开发与应用