中文摘要 | 第4-6页 |
Abstract | 第6-7页 |
第1章 绪论 | 第11-17页 |
1.1 研究背景 | 第11-12页 |
1.2 研究目的和意义 | 第12页 |
1.3 研究现状 | 第12-14页 |
1.4 可变剪接与癌症 | 第14-15页 |
1.5 论文章节安排 | 第15-17页 |
第2章 可变剪接基础知识及相关算法 | 第17-29页 |
2.1 RNA测序 | 第17-21页 |
2.1.1 RNA-seq测序数据 | 第18-19页 |
2.1.3 RNA-seq数据处理 | 第19-21页 |
2.1.4 RNA-seq数据存储格式 | 第21页 |
2.2 可变剪接 | 第21-24页 |
2.2.1 剪接 | 第21-22页 |
2.2.2 可变剪接 | 第22-23页 |
2.2.3 可变剪接类型 | 第23-24页 |
2.3 基于新一代高通量RNA测序数据下的可变剪接 | 第24-27页 |
2.3.1 读段定位 | 第24-25页 |
2.3.2 数据分析软件 | 第25-26页 |
2.3.3 可变剪接位点预测软件 | 第26-27页 |
2.4 本章小结 | 第27-29页 |
第3章 基于随机森林的剪接位点预测算法 | 第29-45页 |
3.1 引言 | 第29-32页 |
3.2 实验数据和方法 | 第32-40页 |
3.2.1 拼接网站数据集 | 第32页 |
3.2.2 基于马尔可夫的编码方法 | 第32-33页 |
3.2.3 随机森林分类器 | 第33-35页 |
3.2.4 支持向量机分类器 | 第35页 |
3.2.5 Fisher评分特征排名方法 | 第35页 |
3.2.6 随机森林特征排序方法 | 第35-37页 |
3.2.7 分类绩效评估指标 | 第37页 |
3.2.8 交叉验证设计 | 第37-38页 |
3.2.9 分类器之间的统计比较 | 第38页 |
3.2.10 评估射频性能的建议方法 | 第38-40页 |
3.3 随机森林预测分析 | 第40-44页 |
3.3.1 RF的效率作为特征排序方法 | 第40-41页 |
3.3.2 RF作为分类器的效率 | 第41-44页 |
3.4 本章小结 | 第44-45页 |
第4章 从RNA-seq数据中识别可变剪接算法的研究 | 第45-61页 |
4.1 引言 | 第45页 |
4.2 算法描述 | 第45-57页 |
4.2.1 定义和表示法 | 第46-54页 |
4.2.2 检测可变剪接事件 | 第54-55页 |
4.2.3 量化剪接事件 | 第55-57页 |
4.3 评估和测试 | 第57-59页 |
4.3.1 检测新事件 | 第57-59页 |
4.4 本章小结 | 第59-61页 |
第5章 基于RNA-seq数据的可变剪接与疾病的联系 | 第61-71页 |
5.1 引言 | 第61-62页 |
5.2 实验结果分析 | 第62-67页 |
5.2.1 基因水平的信号比较U133Plus2.0和外显子阵列的正常组织 | 第62-63页 |
5.2.2 用于检测剪接变体的工作流程 | 第63-65页 |
5.2.3 RT-PCR验证结肠癌中差异性剪接 | 第65-66页 |
5.2.4 已验证的拼接事件 | 第66-67页 |
5.2.5 验证以前报告的拼接事件 | 第67页 |
5.3 本章小结 | 第67-71页 |
结论 | 第71-73页 |
参考文献 | 第73-81页 |
致谢 | 第81-83页 |
攻读硕士学位期间发表的学术论文 | 第83页 |