摘要 | 第4-6页 |
ABSTRACTS | 第6-7页 |
第一章 绪论 | 第10-17页 |
1.1 研究背景及意义 | 第10页 |
1.2 DNA测序技术介绍 | 第10-15页 |
1.2.1 第一代测序技术——桑格测序 | 第10-12页 |
1.2.2 下一代测序技术 | 第12-14页 |
1.2.3 下一代测序优点 | 第14-15页 |
1.3 本文的研究目的和内容 | 第15-17页 |
第二章 下一代测序纠错相关技术分析 | 第17-37页 |
2.1 下一代测序纠错过程 | 第17-22页 |
2.2 基于不同底层的下一代测序纠错算法 | 第22-25页 |
2.3 常用基因数据存储方式分析 | 第25-31页 |
2.3.1 线性数组 | 第25-27页 |
2.3.2 链表 | 第27-28页 |
2.3.3 散列表/散列集合 | 第28-31页 |
2.4 传统区分正误基因序列方法分析基于汉明距离的区分方法 | 第31-34页 |
2.5 传统基因纠错方法分析——基于k-频率的错误纠正算法 | 第34-37页 |
第三章 改进基因数据存储方式 | 第37-43页 |
3.1 Bloom Filter介绍 | 第37页 |
3.2 Bloom Filter原理 | 第37-39页 |
3.3 Bloom Filter特点 | 第39-40页 |
3.4 Bloom Filter的错误率、哈希函数数量以及数组长度的确定 | 第40-43页 |
第四章 改进区分正误k-mer序列的方法 | 第43-63页 |
4.1 互信息相关介绍 | 第43-49页 |
4.1.1 皮尔森相关系数 | 第43-45页 |
4.1.2 互信息 | 第45-49页 |
4.2 期望最大化算法相关介绍 | 第49-53页 |
4.2.1 最大似然估计 | 第49-50页 |
4.2.2 期望最大化算法介绍 | 第50-51页 |
4.2.3 期望最大化算法简介 | 第51页 |
4.2.4 期望最大化算法计算过程 | 第51-53页 |
4.3 改进方法——基于互信息以及期望最大化的区分方法 | 第53-63页 |
4.3.1 计算k-mer序列的互信息值 | 第53-59页 |
4.3.2 利用期望最大化算法区分受信任和不受信任的k-mer序列 | 第59-63页 |
第五章 改进基因纠错方法 | 第63-70页 |
5.1 改进基因纠错方法——多序列比对和k-频率方法相结合的错误纠正算法 | 第63-66页 |
5.2 利用改进基因纠错方法对测序结果进行纠正 | 第66-70页 |
第六章 实验 | 第70-85页 |
6.1 实验环境 | 第70页 |
6.2 实验数据 | 第70-71页 |
6.3 实验过程 | 第71-85页 |
6.3.1 将待纠错读段集合切分成k-mer序列 | 第74页 |
6.3.2 计算k-mer序列集合的互信息 | 第74-76页 |
6.3.3 利用期望最大化算法拟合k-mer序列集合的频率分布 | 第76-78页 |
6.3.4 获得受信任的k-mer序列集合 | 第78-80页 |
6.3.5 使用Bloom Filter存储受信任的k-mer序列 | 第80-81页 |
6.3.6 使用多序列比对和k-频率方法相结合的错误纠正算法进行纠错 | 第81-85页 |
第七章 总结与展望 | 第85-87页 |
7.1 论文总结 | 第85页 |
7.2 论文的不足与展望 | 第85-87页 |
参考文献 | 第87-90页 |
致谢 | 第90-91页 |
攻读硕士学位期间参与项目和发表论文情况 | 第91页 |