| 摘要 | 第5-7页 |
| ABSTRACT | 第7-8页 |
| 符号对照表 | 第11-12页 |
| 缩略语对照表 | 第12-15页 |
| 第一章 绪论 | 第15-21页 |
| 1.1 生物背景知识 | 第15-16页 |
| 1.2 基因表达预测模型的研究意义及现状 | 第16-18页 |
| 1.2.1 转录因子、组蛋白修饰、DNase I位点的研究及现状 | 第16-17页 |
| 1.2.2 转录因子、组蛋白修饰、DNase I之间关联的研究及现状 | 第17-18页 |
| 1.3 基因表达预测模型研究现状存在的问题 | 第18-19页 |
| 1.4 论文主要内容 | 第19-21页 |
| 第二章 基本概念和原理 | 第21-27页 |
| 2.1 基因表达调控相关概念 | 第21页 |
| 2.2 基因表达的RNA-seq数据集 | 第21-23页 |
| 2.3 多元线性回归模型 | 第23-25页 |
| 2.4 Bootstrap方法与交叉验证 | 第25-26页 |
| 2.5 本章小结 | 第26-27页 |
| 第三章 基于多元线性回归模型的基因表达预测 | 第27-41页 |
| 3.1 转录因子、组蛋白和DNase I模型 | 第27-28页 |
| 3.1.1 TFAS模型 | 第27页 |
| 3.1.2 组蛋白修饰和DNase I模型 | 第27-28页 |
| 3.2 实验数据 | 第28-30页 |
| 3.2.1 FIMO+PWM实验数据 | 第28-30页 |
| 3.3 基于bin的多元线性回归模型 | 第30-33页 |
| 3.4 基于多元线性回归模型不同数据的实验结果分析 | 第33-39页 |
| 3.4.1 多元线性回归模型预测结果的相关性分析 | 第33-36页 |
| 3.4.2 多元线性回归模型回归系数的统计检验 | 第36-39页 |
| 3.5 本章小结 | 第39-41页 |
| 第四章 基于支持向量回归的基因表达预测 | 第41-51页 |
| 4.1 支持向量回归机(SVR)模型 | 第41-42页 |
| 4.2 R语言中支持向量回归算法实现 | 第42-43页 |
| 4.3 实验数据和预处理 | 第43-45页 |
| 4.3.1 支持向量回归核函数的选取 | 第43-44页 |
| 4.3.2 转录因子的筛选 | 第44-45页 |
| 4.3.3 FIMO+H3Keme3数据 | 第45页 |
| 4.4 实验过程 | 第45-46页 |
| 4.5 实验结果分析 | 第46-49页 |
| 4.6 本章小结 | 第49-51页 |
| 第五章 基于回归树的基因表达预测 | 第51-65页 |
| 5.1 构建回归树模型 | 第51-52页 |
| 5.2 回归树模型优化 | 第52-53页 |
| 5.3 R语言中的回归树模型求解 | 第53-55页 |
| 5.4 基于线性变换的回归树 | 第55-57页 |
| 5.5 实验过程 | 第57页 |
| 5.6 实验结果分析 | 第57-63页 |
| 5.7 本章小结 | 第63-65页 |
| 第六章 结论与展望 | 第65-67页 |
| 6.1 结论研究 | 第65页 |
| 6.2 研究展望 | 第65-67页 |
| 参考文献 | 第67-71页 |
| 致谢 | 第71-73页 |
| 作者简介 | 第73-74页 |