首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向海量数据实时分析的近似查询算法研究

摘要第3-4页
Abstract第4页
1 绪论第8-16页
    1.1 研究背景及意义第8-10页
    1.2 研究现状第10-13页
        1.2.1 数据实时处理与近似算法第10-11页
        1.2.2 近似查询技术第11-12页
        1.2.3 内存计算与流式处理第12-13页
    1.3 研究内容及组织结构第13-15页
        1.3.1 研究内容第13-14页
        1.3.2 组织结构第14-15页
    1.4 本章小结第15-16页
2 相关概念与技术第16-24页
    2.1 近似查询技术第16-18页
        2.1.1 基本概念第16页
        2.1.2 窗口查询技术第16-17页
        2.1.3 抽样技术第17-18页
    2.2 海量流数据处理技术第18-23页
        2.2.1 相关概念及特性第18-19页
        2.2.2 批量计算和流式计算第19-23页
    2.3 本章小结第23-24页
3 面向批处理的海量数据分层聚类算法第24-40页
    3.1 因子分析第24-27页
        3.1.1 方法原理第24-26页
        3.1.2 方法流程第26-27页
    3.2 K-means聚类分析第27-28页
    3.3 HC-UPGMD算法第28-36页
        3.3.1 最大最小距离聚类第29-32页
        3.3.2 UPGMA优化聚类中心第32-34页
        3.3.3 HC-UPGMD算法第34-36页
    3.4 HC-UPGMD算法性能验证第36-39页
        3.4.1 实验环境第36页
        3.4.2 实验数据集第36-37页
        3.4.3 算法实验结果分析第37-39页
    3.5 本章小结第39-40页
4 面向流处理的滑动窗口分层抽样算法第40-49页
    4.1 滑动窗口数据流概要生成技术第40-41页
        4.1.1 基本窗口技术第40页
        4.1.2 指数直方图技术第40-41页
        4.1.3 CS技术第41页
    4.2 衰减滑动窗口及衰减函数第41-42页
    4.3 SS-ASWWA算法第42-45页
        4.3.1 算法背景第42-43页
        4.3.2 算法原理第43-45页
        4.3.3 算法特性分析第45页
    4.4 算法性能验证第45-48页
        4.4.1 实验设置第45页
        4.4.2 实验结果分析第45-48页
    4.5 本章小结第48-49页
5 面向海量数据实时分析的近似查询模型第49-62页
    5.1 面向海量数据实时分析的近似查询模型设计第49-52页
        5.1.1 相关定义第49-50页
        5.1.2 近似查询模型第50-52页
    5.2 模型与算法实现第52-57页
        5.2.1 总体历史数据分层聚类hash处理第53-54页
        5.2.2 查询算法实现第54-56页
        5.2.3 分层器实现第56-57页
        5.2.4 总体历史数据中数据抽样更新第57页
    5.3 实验分析第57-61页
        5.3.1 实验1:置信度指标性能提升实验第58-59页
        5.3.2 实验2:误差度指标性能提升实验第59-60页
        5.3.3 UCI数据集置信度实验第60-61页
    5.4 本章小结第61-62页
6 总结与展望第62-64页
    6.1 全文总结第62页
    6.2 研究展望第62-64页
致谢第64-65页
参考文献第65-69页
附录第69页

论文共69页,点击 下载论文
上一篇:基于代数规约的Web服务测试执行技术研究
下一篇:基于MMF-OODA的海军装备体系贡献度评估方法研究