中文摘要 | 第3-4页 |
英文摘要 | 第4页 |
1 绪论 | 第7-13页 |
1.1 逆转录转座子简介 | 第7页 |
1.2 L1简介 | 第7-9页 |
1.2.1 的组成 | 第8页 |
1.2.2 L15’UTR功能位点 | 第8页 |
1.2.3 L1 ORF1编码蛋白质的结构特征 | 第8-9页 |
1.2.4 L1 ORF2编码蛋白质的结构特征 | 第9页 |
1.3 目前主流L1活性测定方法 | 第9-10页 |
1.4 通过突变实验分析L1各个部分的功能 | 第10页 |
1.5 L1Xplore分析L1的工具 | 第10-11页 |
1.6 研究的意义及方法设计、预期结果 | 第11-13页 |
2 DNA序列的特征值生成方法 | 第13-18页 |
2.1 支持向量机方法简介 | 第13-15页 |
2.2 支持向量机方法的应用 | 第15页 |
2.3 DNA分子的序列特征生成方法 | 第15-17页 |
2.3.1 利用几何学方法计算DNA序列描述符 | 第15-16页 |
2.3.2 图论法计算DNA序列描述符 | 第16页 |
2.3.3 基于特征值的分子描述符 | 第16页 |
2.3.4 基于马尔科夫链的特征值 | 第16-17页 |
2.4 本章小结 | 第17-18页 |
3 构建L1的支持向量机模型 | 第18-33页 |
3.1 基于碱基分类的DNA特征序列的生成方法 | 第18-19页 |
3.2 Global protein sequence descriptors法生成序列特征值 | 第19-20页 |
3.3 已知活性L1序列的收集 | 第20-26页 |
3.4 正负数据的划分方法 | 第26-28页 |
3.5 从克隆序列中提取L1序列 | 第28页 |
3.6 五则交叉验证法确定模型参数 | 第28-30页 |
3.6.1 五则交叉验证法中原始数据分组方法 | 第28页 |
3.6.2 模型性能的评价方法 | 第28-29页 |
3.6.3 通过五则交叉验证法确定SVM的最佳参数 | 第29-30页 |
3.7 独立验证法验证SVM模型的准确度 | 第30-31页 |
3.7.1 Independent test数据集的产生方法 | 第30-31页 |
3.7.2 Independent test结果和分析 | 第31页 |
3.8 本章小结 | 第31-33页 |
4 人类基因组中L1活性预测 | 第33-41页 |
4.1 人类基因组L1数据库构建 | 第33-37页 |
4.1.1 使用RepeatMasker注释人类基因组中的L1序列 | 第33-36页 |
4.1.2 人类基因组中L1序列的筛选 | 第36-37页 |
4.2 预测人类基因组中有活性的L1数量 | 第37-40页 |
4.3 本章小结 | 第40-41页 |
5 全文总结 | 第41-43页 |
致谢 | 第43-44页 |
参考文献 | 第44-48页 |
附录 | 第48-59页 |