首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

RNA-Seq Reads mapping中基于Spark的并行FM-Index算法研究

中文摘要第3-5页
abstract第5-7页
第1章 绪论第13-23页
    1.1 研究背景第13-16页
        1.1.1 生物信息学和组学大数据第13-14页
        1.1.2 RNA-SeqReadsmapping问题分析第14-16页
    1.2 研究现状第16-19页
        1.2.1 转录组RNA-Seq测序第16-17页
        1.2.2 大数据与云计算技术第17-19页
        1.2.3 Readsmapping算法第19页
    1.3 研究内容第19-21页
    1.4 研究目标第21页
    1.5 本文组织与结构第21-23页
第2章 Spark分布式计算框架技术第23-31页
    2.1 概述第23-24页
    2.2 弹性分布式数据集第24-26页
    2.3 函数化算子第26-27页
    2.4 分布式共享变量第27页
    2.5 Spark计算集群第27-28页
    2.6 分布式文件系统第28-29页
    2.7 本章总结与讨论第29-31页
第3章 Readsmapping算法的比较和选择第31-41页
    3.1 常用Readsmapping算法介绍第31-36页
    3.2 Readsmapping算法比较第36-38页
    3.3 四种Readsmapping算法的比对结果第38-39页
    3.4 本章总结与讨论第39-41页
第4章 基于Spark的并行FM-Index算法的设计与实现第41-49页
    4.1 概述第41页
    4.2 串行化算法原理第41-42页
    4.3 并行化设计第42-45页
        4.3.1 并行优化第42-43页
        4.3.2 技术路线第43-45页
    4.4 基于Spark的FM-Index算法实现第45-47页
    4.5 本章总结与讨论第47-49页
第5章 实验结果与分析第49-59页
    5.1 实验环境与数据准备第49-53页
        5.1.1 系统的软硬件环境第49页
        5.1.2 Spark平台的安装与配置第49-51页
        5.1.3 实验数据的准备第51-53页
    5.2 实验结果分析第53-56页
        5.2.1 序列比对正确率第53-54页
        5.2.2 运行时间第54-55页
        5.2.3 并行加速比第55-56页
    5.3 本章总结与讨论第56-59页
第6章 总结与展望第59-61页
    6.1 本文工作总结第59-60页
    6.2 下一步研究方向第60-61页
参考文献第61-67页
致谢第67-68页
攻读学位期间发表的论文及参与的项目第68页

论文共68页,点击 下载论文
上一篇:社交网络中融合社交关系和语义信息的推荐算法研究
下一篇:基于相似性计算与半监督聚类方法的微博广告发布者识别研究