摘要 | 第8-11页 |
Abstract | 第11-14页 |
第一章 前言 | 第15-26页 |
1.1 研究背景 | 第15-18页 |
1.1.1 新一代测序技术 | 第15-16页 |
1.1.2 后基因组研究 | 第16-17页 |
1.1.3 多组学分析 | 第17-18页 |
1.2 研究现状 | 第18-22页 |
1.2.1 常用的浅层学习软件 | 第19页 |
1.2.2 深度学习概述 | 第19-21页 |
1.2.3 其他机器学习算法简介 | 第21-22页 |
1.3 拟解决的科学问题 | 第22-23页 |
1.4 研究内容和论文结构 | 第23-26页 |
第二章 基于深度学习的人类基因组复制时间域的识别与注释研究 | 第26-57页 |
2.1 摘要 | 第26页 |
2.2 引言 | 第26-28页 |
2.3 结果 | 第28-49页 |
2.3.1 DNN-HMM的开发和性能评估 | 第28-30页 |
2.3.2 DNN-HMM算法与其他已有方法的性能比较 | 第30-32页 |
2.3.3 不同复制时间域的识别和性质描述 | 第32-34页 |
2.3.4 不同复制时间域的染色质标记和转录状态 | 第34-45页 |
2.3.5 不同复制时间域的染色质架构 | 第45-49页 |
2.4 讨论 | 第49-50页 |
2.5 材料与方法 | 第50-57页 |
2.5.1 数据集 | 第50-51页 |
2.5.2 复制时间分析 | 第51页 |
2.5.3 深信网络 | 第51-52页 |
2.5.4 DNN-HMM架构 | 第52-53页 |
2.5.5 利用DNN-HMM识别复制时间域 | 第53-54页 |
2.5.6 DNN-HMM算法的性能评估 | 第54页 |
2.5.7 基因组结构相关的统计分析 | 第54-55页 |
2.5.8 复制时间域中的模式序列富集分析 | 第55页 |
2.5.9 复制时间域和周围区域的密度谱 | 第55页 |
2.5.10 复制时间域中的转录因子富集分析 | 第55-56页 |
2.5.11 复制时间域与相关绑定位点的共区域化分析 | 第56页 |
2.5.12 复制时间谱与染色质标记谱的相关性分析 | 第56页 |
2.5.13 复制时间域中Hi-C数据分析 | 第56-57页 |
第三章 基于深度学习的人类基因组增强子的识别研究 | 第57-79页 |
3.1 摘要 | 第57页 |
3.2 引言 | 第57-59页 |
3.3 结果 | 第59-73页 |
3.3.1 PEDLA利用异构数据预测增强子 | 第59-62页 |
3.3.2 PEDLA具备无偏地处理类别不平衡数据的能力 | 第62-63页 |
3.3.3 PEDLA与已有方法的性能比较 | 第63-65页 |
3.3.4 不同方法的进一步性能比较 | 第65-68页 |
3.3.5 PEDLA在多细胞/组织中的增强子预测 | 第68-72页 |
3.3.6 在多细胞中与DEEP算法的性能比较 | 第72-73页 |
3.4 讨论和结论 | 第73-75页 |
3.5 材料与方法 | 第75-79页 |
3.5.1 特征数据 | 第75页 |
3.5.2 不同数据类型的统一数据标准化 | 第75-76页 |
3.5.3 阳性和阴性集合的构建 | 第76页 |
3.5.4 PEDLA的训练和预测过程 | 第76-77页 |
3.5.5 PEDLA性能的评估 | 第77-78页 |
3.5.6 PEDLA最优结构的选择 | 第78页 |
3.5.7 预测的增强子的验证 | 第78-79页 |
第四章 基于深度学习和集成学习的RNA编辑位点的识别研究 | 第79-92页 |
4.1 摘要 | 第79页 |
4.2 引言 | 第79-81页 |
4.3 结果 | 第81-88页 |
4.3.1 RNA编辑位点识别算法框架的设计和评估 | 第81-82页 |
4.3.2 单细胞DeepRed算法的结构设计和确定 | 第82-84页 |
4.3.3 DeepRed算法在U87细胞系中的评估和验证 | 第84-86页 |
4.3.4 多细胞DeepRed算法的设计和评估 | 第86-88页 |
4.4 讨论 | 第88-90页 |
4.5 材料与方法 | 第90-92页 |
4.5.1 训练集的构建 | 第90页 |
4.5.2 输入特征 | 第90页 |
4.5.3 4种不同的基于深度学习的并行集成学习方案 | 第90-91页 |
4.5.4 5倍交叉验证 | 第91-92页 |
第五章 人类基因组增强子RNA的识别与注释研究 | 第92-116页 |
5.1 摘要 | 第92页 |
5.2 引言 | 第92-94页 |
5.3 结果 | 第94-110页 |
5.3.1 活性增强子的识别和基本性质 | 第94-96页 |
5.3.2 活性增强子中不同染色质标记的富集情况 | 第96-99页 |
5.3.3 多细胞类型和组织的活性增强子 | 第99-102页 |
5.3.4 淋巴细胞eRNA中已知结构ncRNA的注释 | 第102-103页 |
5.3.5 淋巴细胞eRNA中新的结构ncRNA的注释 | 第103-105页 |
5.3.6 淋巴细胞eRNA中riboSNitches的注释 | 第105-110页 |
5.4 结论 | 第110-111页 |
5.5 材料与方法 | 第111-116页 |
5.5.1 数据集 | 第111页 |
5.5.2 数据处理 | 第111-112页 |
5.5.3 Hi-C数据分析 | 第112页 |
5.5.4 转录因子模式序列的富集分析 | 第112页 |
5.5.5 GO分析 | 第112页 |
5.5.6 活性增强子的相关分析 | 第112-113页 |
5.5.7 淋巴细胞中已知结构的非编码RNA的注释 | 第113页 |
5.5.8 淋巴细胞中未知结构的非编码RNA的预测 | 第113-114页 |
5.5.9 淋巴细胞中新的长链非编码RNA的注释 | 第114-115页 |
5.5.10 淋巴细胞中新的riboSNitches的预测 | 第115-116页 |
第六章 总结与展望 | 第116-120页 |
6.1 论文总结 | 第116-117页 |
6.2 论文特色 | 第117-118页 |
6.3 未来展望 | 第118-120页 |
参考文献 | 第120-130页 |
个人简历 | 第130-131页 |
致谢 | 第131页 |