摘要 | 第3-4页 |
Abstract | 第4-5页 |
第1章 引言 | 第9-25页 |
1.1 概述 | 第9-10页 |
1.2 一代测序(Sanger测序) | 第10-11页 |
1.2.1 Sanger测序原理 | 第10-11页 |
1.2.2 Sanger测序意义 | 第11页 |
1.3 二代测序(高通量测序,下一代测序) | 第11-12页 |
1.3.1 二代测序基本介绍 | 第11-12页 |
1.3.2 二代测序基本步骤 | 第12页 |
1.4 Roche 454测序仪 | 第12-14页 |
1.4.1 Roche 454基本原理 | 第12-14页 |
1.4.2 Roche 454技术特点 | 第14页 |
1.5 Illumina公司Solexa测序 | 第14-16页 |
1.5.1 Solexa测序基本原理 | 第14-16页 |
1.5.2 Solexa测序技术特点 | 第16页 |
1.6 ABI Life Technologies SOLiD System | 第16-19页 |
1.6.1 SOLiD测序基本原理 | 第16-18页 |
1.6.2 SOLiD测序的技术特点 | 第18-19页 |
1.7 Ion Torrent PGM | 第19-22页 |
1.7.1 Ion Torrent测序原理 | 第19-21页 |
1.7.2 Ion Torrent测序技术特点 | 第21-22页 |
1.8 单核苷酸多态性(Single Nucleotide Polymorphism,SNP) | 第22页 |
1.9 本研究的内容、目的和意义 | 第22-25页 |
第2章 材料和方法 | 第25-50页 |
2.1 Linux Ubuntu操作系统 | 第25页 |
2.2 计算机硬件 | 第25-26页 |
2.3 Perl编程脚本语言 | 第26页 |
2.4 数据来源 | 第26-28页 |
2.5 二代测序数据格式 | 第28-31页 |
2.5.1 Base calling评价指标:qual ity score | 第28-29页 |
2.5.2 二代测序原始数据文件:Fastq文件 | 第29-31页 |
2.6 二代测序数据处理内容 | 第31-41页 |
2.6.1 序列比对 | 第31-34页 |
2.6.2 SAM和BAM文件 | 第34-36页 |
2.6.3 碱基质量校准 | 第36-41页 |
2.7 二代测序数据分析方法学及发展 | 第41-43页 |
2.7.1 基因分型和SNP calling的关系 | 第41页 |
2.7.2 基因分型方法及其改进的概率方法学 | 第41-42页 |
2.7.3 连锁不平衡的应用 | 第42-43页 |
2.8 二代测序SNP结果分析 | 第43-48页 |
2.8.1 SNP calling | 第43-44页 |
2.8.2 SNP的VCF格式 | 第44-45页 |
2.8.3 SNP结果的过滤和优化 | 第45-48页 |
2.9 小结 | 第48-50页 |
第3章 结果 | 第50-66页 |
3.1 酵母基因组SNP图谱构建 | 第50-58页 |
3.1.1 酵母基因组序列比对 | 第50-51页 |
3.1.2 序列比对后续分析 | 第51-54页 |
3.1.3 Ti/Tv | 第54-56页 |
3.1.4 单个SNP位点共有菌种个数 | 第56-57页 |
3.1.5 SNP注释信息 | 第57-58页 |
3.2 Ion Torrent测序质量评价 | 第58-66页 |
3.2.1 编程抽取、处理碱基变异信息 | 第58-60页 |
3.2.2 Homozygous和测序错误之间的关系 | 第60-61页 |
3.2.3 Homozygous对测序的影响 | 第61页 |
3.2.4 Swap型Mi smatch | 第61-62页 |
3.2.5 Ion Torrent测序初步评价及初步改善 | 第62-64页 |
3.2.6 Mismatch和Free error质量值的比较 | 第64-66页 |
第四章 讨论 | 第66-69页 |
4.1 二代测序技术的发展 | 第66-67页 |
4.2 二代测序数据分析发展及建议 | 第67页 |
4.3 展望 | 第67-69页 |
致谢 | 第69-70页 |
参考文献 | 第70-75页 |
附录A | 第75-77页 |
附录B | 第77-86页 |