内容摘要 | 第5-7页 |
abstract | 第7-8页 |
1.研究背景 | 第16-31页 |
1.1 转录组测序(RNA-seq)技术发展现状 | 第16-17页 |
1.2 转录组测序数据分析流程 | 第17-21页 |
1.2.1 转录组测序数据的不同分析流程 | 第17-18页 |
1.2.2 有参考基因组序列时的转录组测序数据分析流程 | 第18页 |
1.2.3 转录组拼接采用的图论模型介绍 | 第18-19页 |
1.2.4 现有的转录组拼接软件所包含的缺陷 | 第19-21页 |
1.3 本论文主要应用到的部分软件介绍 | 第21-29页 |
1.3.1 IGV软件 | 第21-24页 |
1.3.2 FluxSimulator软件 | 第24-26页 |
1.3.3 Cufflinks组件中的Cuffcompare工具 | 第26-28页 |
1.3.4 ASATP软件 | 第28-29页 |
1.4 主要模式生物的转录组研究现状 | 第29-30页 |
1.5 转录组组装的复杂性 | 第30-31页 |
2.转录组拼接软件QuaPra的开发 | 第31-53页 |
2.1 QuaPra软件读取文件流程 | 第31-32页 |
2.2 QuaPra软件并行化运行的实现 | 第32-36页 |
2.2.1 使用多进程编程进行并行处理 | 第32-33页 |
2.2.2 并行程度最大化的实现 | 第33-34页 |
2.2.3 对内存空间的节约 | 第34-35页 |
2.2.4 对不同进程的运行结果进行高效的数据共享 | 第35-36页 |
2.3 真实剪切位点的鉴定 | 第36-41页 |
2.3.1 匹配到剪切位点的读段的识别和读取 | 第36-38页 |
2.3.2 剪切位点的常规过滤 | 第38-40页 |
2.3.3 剪切位点的深度过滤 | 第40-41页 |
2.4 基因边界的确定及基因内部有向无环图的建立 | 第41-44页 |
2.5 列出所有候选转录本 | 第44-46页 |
2.6 标准化位于外显子和剪切位点的读段数 | 第46-47页 |
2.6.1 标准化位于外显子的读段数 | 第46-47页 |
2.6.2 标准化位于剪切位点的读段数 | 第47页 |
2.7 二次规划的应用 | 第47-51页 |
2.7.1 目标函数 | 第49页 |
2.7.2 约束条件函数 | 第49-51页 |
2.8 Apriori算法的应用 | 第51-53页 |
3.QuaPra软件的性能评估 | 第53-63页 |
3.1 RNA-seq测试数据来源 | 第53-54页 |
3.2 模拟数据集的性能衡量标准 | 第54-55页 |
3.2.1 基因/转录本识别能力的衡量标准 | 第54-55页 |
3.2.2 定量性能的衡量标准 | 第55页 |
3.3 多转录本基因探测的具体案例 | 第55-56页 |
3.4 QuaPra和其他同类软件的性能比较 | 第56-63页 |
3.4.1 模拟数据集里QuaPra和其他软件之间的性能比较 | 第56-60页 |
3.4.2 真实数据集里QuaPra和其他软件之间的性能比较 | 第60-63页 |
4.结合QuaPra和Stringtie重构大鼠转录组 | 第63-71页 |
4.1 大鼠RNA-seq数据来源 | 第63页 |
4.2 大鼠RNA-Seq读段匹配和转录本拼接的流程 | 第63-69页 |
4.3 具有高可信度的新的可编码和非编码转录本的筛选 | 第69页 |
4.4 在人和小鼠中保守的大鼠剪切位点的鉴定 | 第69-70页 |
4.5 RTR中的重复元件分析 | 第70-71页 |
5.大鼠转录组重构结果分析 | 第71-84页 |
5.1 重构的大鼠转录组 | 第71-73页 |
5.2 大鼠基因的全新剪切位点 | 第73-75页 |
5.3 大鼠新的剪接异构体和可变剪切事件 | 第75-78页 |
5.4 大鼠新的基因编码能力与功能注释 | 第78-80页 |
5.5 转座因子与基因的位置关系分析 | 第80-81页 |
5.6 大鼠组织间的基因和转录本表达模式 | 第81-84页 |
6.结语 | 第84-87页 |
6.1 讨论 | 第84-85页 |
6.2 展望 | 第85-87页 |
参考文献 | 第87-92页 |
附录 | 第92-106页 |
附录1:QuaPraV1.0使用说明 | 第92-103页 |
QuaPra运行环境的配置 | 第92-93页 |
动态链接库的配置 | 第93页 |
软件文件夹中所自带的文件 | 第93-95页 |
必需输入文件 | 第95页 |
软件的安装 | 第95-96页 |
软件的使用 | 第96-98页 |
输出文件的介绍 | 第98-103页 |
附录2:RTR中发现的剪切因子 | 第103页 |
附录3:QuaPra软件里的相关封装函数 | 第103-106页 |
列出读段在所匹配到的基因组区域的坐标(显示剪切位点区域) | 第103-104页 |
列出读段能匹配到基因组的部分在读段自身上的坐标(显示剪切位点区域) | 第104-105页 |
提取外显子或转录本列表中的外显子边界点信息 | 第105-106页 |
后记 | 第106-108页 |
个人简历及在学期间所取得的科研成果 | 第108页 |
个人简历 | 第108页 |
发表的学术论文与研究成果 | 第108页 |