摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
第1章 绪论 | 第14-30页 |
1.1 课题背景及意义 | 第14-16页 |
1.1.1 研究背景 | 第14-15页 |
1.1.2 研究意义 | 第15-16页 |
1.2 相关知识介绍 | 第16-24页 |
1.2.1 序列分析技术简介 | 第16-17页 |
1.2.2 测序技术简介 | 第17-22页 |
1.2.3 基因组结构变异简介 | 第22页 |
1.2.4 非编码RNA简介 | 第22-23页 |
1.2.5 Map Reduce技术简介 | 第23-24页 |
1.3 国内外研究现状 | 第24-28页 |
1.3.1 高通量数据的聚类与拼接 | 第24-26页 |
1.3.2 生物分子标记的识别 | 第26-28页 |
1.4 本文主要工作 | 第28-30页 |
第2章 基于MAPREDUCE的生物序列聚类算法 | 第30-54页 |
2.1 引言 | 第30-34页 |
2.1.1 问题描述 | 第31-32页 |
2.1.2 相关算法 | 第32-34页 |
2.2 基于共享k-mer计数的序列相似度计算方法 | 第34-38页 |
2.2.1 基于共享k-mer计数的序列相似度 | 第34-35页 |
2.2.2 基于Map Reduce的序列共享k-mer计数算法 | 第35-38页 |
2.3 基于块比对的序列相似度计算方法 | 第38-47页 |
2.3.1 全局比对和局部比对算法 | 第38-40页 |
2.3.2 基于共享k-mers扩展块的局部块比对 | 第40-43页 |
2.3.3 边加权有向无环图单源最长路径算法 | 第43-46页 |
2.3.4 局部块比对的优化 | 第46-47页 |
2.4 序列聚类算法 | 第47-49页 |
2.5 实验与分析 | 第49-52页 |
2.6 本章小结 | 第52-54页 |
第3章 基于读片段聚类的高通量数据拼接算法 | 第54-79页 |
3.1 引言 | 第54-59页 |
3.1.1 拼接方法及相关算法 | 第55-57页 |
3.1.2 问题描述 | 第57-59页 |
3.2 NGS读片段聚类算法 | 第59-65页 |
3.2.1 数据预处理 | 第59页 |
3.2.2 生成k-mer群组 | 第59-61页 |
3.2.3 读片段的聚类 | 第61-65页 |
3.3 基于欧拉路径的contig建立算法 | 第65-69页 |
3.3.1 Seeds Graph的构建 | 第65-66页 |
3.3.2 Seeds Graph中重复路径的分析 | 第66-68页 |
3.3.3 Contigs的生成方法 | 第68-69页 |
3.4 基于mate-pair的scaffold建立方法 | 第69-72页 |
3.4.1 Contigs间的相对方向 | 第70-71页 |
3.4.2 Contigs的定位方法 | 第71-72页 |
3.4.3 填充gap和生成scaffolds | 第72页 |
3.5 实验与分析 | 第72-77页 |
3.6 本章小结 | 第77-79页 |
第4章 基于高通量测序的多供体结构变异识别算法 | 第79-104页 |
4.1 引言 | 第79-85页 |
4.1.1 结构变异及其重要作用 | 第80-81页 |
4.1.2 结构变异识别方法的研究现状 | 第81-82页 |
4.1.3 问题描述 | 第82-85页 |
4.2 基于Map Reduce的读片段定位方法 | 第85-89页 |
4.2.1 不一致的读片段对 | 第86页 |
4.2.2 基于Map Reduce的筛选算法 | 第86-89页 |
4.2.3 合并多供体的候选读片段 | 第89页 |
4.3 结构变异的识别算法 | 第89-97页 |
4.3.1 小型indel事件的识别方法 | 第90-91页 |
4.3.2 插入事件的识别方法 | 第91-92页 |
4.3.3 缺失事件的识别方法 | 第92-93页 |
4.3.4 倒位事件的识别方法 | 第93-94页 |
4.3.5 易位事件的识别方法 | 第94-95页 |
4.3.6 重复事件的识别方法 | 第95-96页 |
4.3.7 识别算法 | 第96-97页 |
4.4 断点精确预测算法 | 第97-100页 |
4.4.1 基于split-read的断点预测方法 | 第97-99页 |
4.4.2 基于soft clipping的断点预测方法 | 第99-100页 |
4.5 实验与分析 | 第100-103页 |
4.6 本章小结 | 第103-104页 |
第5章 基于同源搜索与集成分类的MIRNA识别方法 | 第104-116页 |
5.1 引言 | 第104-108页 |
5.1.1 相关研究 | 第105-107页 |
5.1.2 识别流程 | 第107-108页 |
5.2 基于Map Reduce的同源序列搜索方法 | 第108-111页 |
5.2.1 数据的预处理 | 第108页 |
5.2.2 同源序列搜索 | 第108-111页 |
5.3 基于集成学习的分类器 | 第111-113页 |
5.3.1 样本集的选择 | 第111页 |
5.3.2 集成分类器的构建 | 第111-113页 |
5.4 实验与分析 | 第113-114页 |
5.5 本章小结 | 第114-116页 |
结论 | 第116-118页 |
参考文献 | 第118-132页 |
攻读博士学位期间发表的论文及其它成果 | 第132-136页 |
致谢 | 第136-137页 |
个人简历 | 第137页 |