摘要 | 第4-6页 |
Abstract | 第6-7页 |
第1章 绪论 | 第14-32页 |
1.1 课题背景及研究的意义 | 第14-17页 |
1.1.1 课题来源 | 第14页 |
1.1.2 课题背景 | 第14-16页 |
1.1.3 研究的目的和意义 | 第16-17页 |
1.2 国内外研究现状 | 第17-30页 |
1.2.1 基因组拼接 | 第17-19页 |
1.2.2 基于高通量测序数据的基因组拼接方法 | 第19-24页 |
1.2.3 测序错误导致的分叉的处理方法 | 第24-25页 |
1.2.4 重复序列导致的分叉的处理方法 | 第25-27页 |
1.2.5 基因组拼接错误的识别方法 | 第27-29页 |
1.2.6 基因组短序列拼存在的主要问题 | 第29-30页 |
1.3 本文的主要研究内容 | 第30-32页 |
第2章 基于支持向量机的分叉结构处理方法 | 第32-47页 |
2.1 引言 | 第32-34页 |
2.2 支持向量机 | 第34-38页 |
2.2.1 最优分类超平面 | 第34-37页 |
2.2.2 支持向量机与核函数 | 第37-38页 |
2.3 基于支持向量机的分叉结构处理方法 | 第38-43页 |
2.3.1 分叉结构及其特征选择 | 第38-40页 |
2.3.2 支持向量机预测模型的生成 | 第40-43页 |
2.4 实验结果与分析 | 第43-46页 |
2.4.1 实验数据 | 第43-44页 |
2.4.2 实验结果与分析 | 第44-46页 |
2.5 本章小结 | 第46-47页 |
第3章 基于向前查看方法的分叉结构处理方法 | 第47-59页 |
3.1 引言 | 第47-49页 |
3.2 向前查看方法 | 第49-56页 |
3.2.1 处理气泡结构 | 第49-51页 |
3.2.2 处理短串联重复序列 | 第51-56页 |
3.3 实验结果与分析 | 第56-58页 |
3.3.1 实验数据 | 第56页 |
3.3.2 实验结果与分析 | 第56-58页 |
3.4 本章小结 | 第58-59页 |
第4章 基于多重启发式的基因组拼接方法 | 第59-97页 |
4.1 引言 | 第59-62页 |
4.2 拼接方法总体思路 | 第62-64页 |
4.3 基于多重启发式的基因组拼接方法 | 第64-79页 |
4.3.1 拼接前数据预处理 | 第64-68页 |
4.3.2 k-mer哈希表的构建 | 第68-71页 |
4.3.3 核心拼接算法 | 第71-74页 |
4.3.4 reads到contig的比对 | 第74-76页 |
4.3.5 利用配对数据进行拼接 | 第76-78页 |
4.3.6 利用可变交叠进行拼接 | 第78-79页 |
4.4 基于配对数据的基因组组装方法 | 第79-85页 |
4.4.1 确定reads在contigs上的位置信息 | 第80页 |
4.4.2 将contigs连接成scaffolds | 第80-81页 |
4.4.3 计算相邻contigs之间的距离 | 第81-84页 |
4.4.4 填充contigs之间的gap | 第84-85页 |
4.5 实验结果与分析 | 第85-96页 |
4.5.1 实验数据 | 第85-86页 |
4.5.2 评价指标 | 第86-88页 |
4.5.3 实验结果与分析 | 第88-96页 |
4.6 本章小结 | 第96-97页 |
第5章 无偏的拼接错误识别方法 | 第97-118页 |
5.1 引言 | 第97-98页 |
5.2 无偏的基因组拼接错误识别方法 | 第98-110页 |
5.2.1 识别拼接结果中的差异 | 第99-103页 |
5.2.2 计算差异的断点区域 | 第103-106页 |
5.2.3 识别拼接错误 | 第106-109页 |
5.2.4 识别对应于结构变异的正确拼接 | 第109-110页 |
5.3 实验结果与分析 | 第110-117页 |
5.3.1 实验数据 | 第110页 |
5.3.2 实验结果与分析 | 第110-117页 |
5.4 本章小结 | 第117-118页 |
结论 | 第118-120页 |
参考文献 | 第120-131页 |
攻读博士学位期间发表的论文 | 第131-133页 |
致谢 | 第133-134页 |
个人简历 | 第134页 |