摘要 | 第6-9页 |
Abstract | 第9-12页 |
缩略词表 | 第13-14页 |
第一章 绪论 | 第14-30页 |
1.1 引言 | 第14-15页 |
1.2 组学大数据概述 | 第15-17页 |
1.3 面向组学大数据的生物信息学研究进展 | 第17-22页 |
1.3.1 云计算技术在生物信息学中的应用 | 第18-20页 |
1.3.2 多组学整合在生物信息学中的应用 | 第20-21页 |
1.3.3 小结和展望 | 第21-22页 |
1.4 论文立题依据、研究内容和创新点 | 第22-25页 |
参考文献 | 第25-30页 |
第二章 基于云计算技术的蛋白质组大数据分析平台的构建及应用 | 第30-47页 |
2.1 引言 | 第30-31页 |
2.2 材料和方法 | 第31-34页 |
2.2.1 基于MapReduce框架的数据库搜索算法 | 第31页 |
2.2.2 基于Target-Decoy搜索策略的FDR控制 | 第31-32页 |
2.2.3 技术实现 | 第32页 |
2.2.4 数据收集 | 第32页 |
2.2.5 构建全基因组六框翻译数据库 | 第32-33页 |
2.2.6 构建错义突变的氨基酸序列数据库 | 第33页 |
2.2.7 基于VCF文件构建错义突变的氨基酸序列数据库 | 第33页 |
2.2.8 构建外显子跳跃剪接的氨基酸序列数据库 | 第33页 |
2.2.9 基于RNA-seq数据构建外显子跳跃剪接的氨基酸序列数据库 | 第33-34页 |
2.2.10 基于track view的染色体蛋白质组浏览器 | 第34页 |
2.2.11 部署AWS AMI | 第34页 |
2.3 结果 | 第34-43页 |
2.3.1 CAPER 3 平台概述 | 第34-38页 |
2.3.2 鉴定新肽段的应用 | 第38-39页 |
2.3.3 鉴定单氨基酸变异肽段的应用 | 第39-40页 |
2.3.4 鉴定样本特异的单氨基酸变异肽段的应用 | 第40-41页 |
2.3.5 外显子跳跃剪接肽段的应用 | 第41-42页 |
2.3.6 亚马逊云服务的费用 | 第42-43页 |
2.4 小结 | 第43-45页 |
参考文献 | 第45-47页 |
第三章 基于生物学网络整合多组学数据进行癌症驱动基因的鉴定 | 第47-64页 |
3.1 引言 | 第47-48页 |
3.2 材料和方法 | 第48-55页 |
3.2.1 TCGA公共数据集的获取和解析 | 第48-49页 |
3.2.2 癌症相关突变的特征分析 | 第49-50页 |
3.2.3 基因错义突变有害程度分析模块 | 第50-51页 |
3.2.4 构建生物学网络模板 | 第51页 |
3.2.5 基于PFIN的分析模块 | 第51-53页 |
3.2.6 基于KEGG通路的分析模块 | 第53-54页 |
3.2.7 三层有向网络的布局 | 第54-55页 |
3.3 结果 | 第55-62页 |
3.3.1 癌症相关突变的特征分析 | 第55-56页 |
3.3.2 Bionexr概述 | 第56-57页 |
3.3.3 在多种肿瘤数据分析中的应用 | 第57-62页 |
3.4 小结 | 第62-63页 |
参考文献 | 第63-64页 |
第四章 讨论与展望 | 第64-69页 |
4.1 引言 | 第64-65页 |
4.2 云计算技术给生物信息学大数据处理体系带来计算灵活性 | 第65页 |
4.3 生物学网络有助于解读组学大数据 | 第65页 |
4.4 本文工作的局限 | 第65-66页 |
4.5 未来展望 | 第66-68页 |
参考文献 | 第68-69页 |
全文总结 | 第69-71页 |
附录 | 第71-100页 |
附录1 MR-Tandem的扩展性能 | 第71-72页 |
附录2 构建癌症相关突变的金标准阳性数据集 | 第72-84页 |
附录3 Bionexr中使用的211个KEGG通路 | 第84-90页 |
附录4 使用Bionexr对TCGA中的乳腺癌、肾癌和子宫内膜癌的分析结果 | 第90-100页 |
综述和论文全文 | 第100-120页 |
个人简介 | 第120-121页 |
计算机软件著作权 | 第121-122页 |
致谢 | 第122-123页 |