首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

面向片上异构多核系统的机器学习算法并行化技术研究

摘要第5-7页
Abstract第7-8页
第1章 绪论第15-25页
    1.1 研究背景与意义第16-19页
        1.1.1 传统嵌入式设备面临的性能瓶颈第16-17页
        1.1.2 多核高性能嵌入式计算发展现状第17-18页
        1.1.3 多核高性能计算在机器学习领域的应用优势第18-19页
    1.2 基于异构多核的机器学习系统相关问题第19-20页
    1.3 论文主要研究内容及创新性工作第20-22页
    1.4 论文组织结构第22-25页
第2章 嵌入式高性能并行计算技术第25-47页
    2.1 并行计算体系结构第25-29页
    2.2 并行计算模型第29-33页
    2.3 并行编程模型第33-35页
    2.4 基于多核处理器的并行计算第35-45页
        2.4.1 多核处理器发展现状第35-36页
        2.4.2 同构、异构多核结构第36-37页
        2.4.3 常见多核处理器分类第37-42页
        2.4.4 典型嵌入式异构多核并行计算系统第42-45页
    2.5 本章小结第45-47页
第3章 异构多核体系结构及程序执行模型第47-57页
    3.1 异构多核系统体系结构模型第47-50页
        3.1.1 异构多核系统应用需求第47-48页
        3.1.2 CPU-多核加速器体系结构模型第48-50页
    3.2 CPU-多核加速器体系结构的的多核通讯架构第50-52页
        3.2.1 CPU-加速器间通讯架构第50-51页
        3.2.2 多核加速器内部通讯架构第51-52页
    3.3 基于任务集合的模块化异构多核程序执行模型第52-54页
        3.3.1 程序执行模型结构第52-53页
        3.3.2 任务单元的多核映射策略第53-54页
        3.3.3 任务单元间协同工作流程第54页
    3.4 本章小结第54-57页
第4章 面向多核系统的典型机器学习算法并行化技术第57-75页
    4.1 机器学习概述第57-60页
    4.2 机器学习算法并行化策略分析第60-62页
    4.3 典型机器学习并行化算法设计第62-68页
        4.3.1 基于数据并行的AdaBoost分类并行化第62-64页
        4.3.2 基于稀疏与数据并行的SVM训练并行化第64-66页
        4.3.3 基于模型并行的多层感知机预测并行化第66-68页
    4.4 实验与分析第68-72页
        4.4.1 AdaBoost分类识别并行化实验第68-69页
        4.4.2 SVM训练并行化实验第69-71页
        4.4.3 多层感知机预测并行化实验第71-72页
    4.5 本章小结第72-75页
第5章 基于Parallella的可扩展并行机器学习算法第75-97页
    5.1 异构多核机器学习实现技术概述第75-76页
    5.2 面向Parallella的机器学习并行算法设计第76-86页
        5.2.1 基于Adaboost的并行目标检测第76-81页
        5.2.2 基于SVM的并行训练第81-82页
        5.2.3 基于多层感知机的并行字符识别第82-86页
    5.3 基于MPI的Parallella集群扩展技术第86-88页
        5.3.1 二级并行系统模型第86-88页
        5.3.2 扩展性度量指标第88页
    5.4 实验与分析第88-94页
        5.4.1 基于Adaboost的人脸检测并行加速系统实验第89-91页
        5.4.2 基于SVM的并行加速学习系统实验第91-92页
        5.4.3 基于多层感知机的字符识别并行加速系统实验第92-93页
        5.4.4 基于MPI的可扩展人脸检测系统实验第93-94页
    5.5 本章小结第94-97页
第6章 基于Parallella的卷积神经网络并行化技术第97-107页
    6.1 基于卷积神经网络的深度学习方法第97-100页
        6.1.1 卷积神经网络第98-99页
        6.1.2 Caffe深度学习平台第99-100页
    6.2 卷积神经网络Parallella多核加速框架第100-104页
        6.2.1 框架基本架构第101-102页
        6.2.2 并行化算法第102-103页
        6.2.3 数据存储与传输策略第103-104页
        6.2.4 Epiphany代码生成器第104页
    6.3 实验与分析第104-105页
    6.4 本章小结第105-107页
第7章 基于Parallella的机器学习应用快速开发框架PML-RADF第107-127页
    7.1 系统架构第107-109页
    7.2 关键模块及算法第109-112页
        7.2.1 核心算法库第109-110页
        7.2.2 数据维护层第110页
        7.2.3 任务调度层第110-111页
        7.2.4 通信适配层第111页
        7.2.5 Epiphany代码生成器第111-112页
    7.3 基于Parallella的快速人脸识别系统应用实例第112-119页
        7.3.1 系统硬件结构第113-114页
        7.3.2 系统软件设计第114-117页
        7.3.3 系统可扩展性设计第117-119页
    7.4 实验与分析第119-125页
        7.4.1 单板人脸识别系统实验第121-124页
        7.4.2 集群人脸识别系统实验第124-125页
    7.5 本章小结第125-127页
结论与展望第127-131页
参考文献第131-141页
攻读博士学位期间取得的研究成果第141-145页
致谢第145页

论文共145页,点击 下载论文
上一篇:基于局部学习的自适应软测量建模方法研究
下一篇:有期限约束多工作流调度的多目标优化研究