摘要 | 第5-7页 |
Abstract | 第7-9页 |
第1章 绪论 | 第16-25页 |
1.1 研究背景及意义 | 第16-17页 |
1.2 国内外的研究现状 | 第17-22页 |
1.2.1 遗传风险因素识别 | 第18-20页 |
1.2.2 复杂疾病分类及风险预测 | 第20-22页 |
1.3 本文研究目的及主要工作 | 第22-23页 |
1.4 本文结构组织 | 第23-25页 |
第2章 复杂疾病SNP数据分析过程及方法介绍 | 第25-43页 |
2.1 基础概念 | 第25-30页 |
2.2 SNP数据质量控制 | 第30-31页 |
2.3 SNP特征子集选择 | 第31-37页 |
2.3.1 组合优化算法 | 第31-34页 |
2.3.2 预测分类模型 | 第34-37页 |
2.4 致病基因识别 | 第37-42页 |
2.4.1 基于单位点的分析方法 | 第37-38页 |
2.4.2 基于上位性的分析方法 | 第38-39页 |
2.4.3 基于生物通路的分析方法 | 第39-40页 |
2.4.4 基于文献挖掘的分析方法 | 第40页 |
2.4.5 基于分子网络的分析方法 | 第40-42页 |
2.5 小结 | 第42-43页 |
第3章 基于组合优化算法的信息SNP选择方法 | 第43-70页 |
3.1 信息SNP与上位性分析 | 第43-44页 |
3.2 基于最大相关性最小冗余的信息SNP选择 | 第44-58页 |
3.2.1 问题定义 | 第44-45页 |
3.2.2 最大关联最小冗余准则 | 第45-46页 |
3.2.3 基于贪婪算法的候选信息SNP子集构造 | 第46-48页 |
3.2.4 信息SNP精选 | 第48页 |
3.2.5 较大规模数据集上重构过程优化 | 第48-49页 |
3.2.6 数据集及评价指标 | 第49-51页 |
3.2.7 三种规模数据集上实验结果 | 第51-56页 |
3.2.8 实验讨论 | 第56-58页 |
3.3 基于最近均值分类的信息SNP选择 | 第58-68页 |
3.3.1 问题定义及数据预处理 | 第58-59页 |
3.3.2 基于最近均值分类的样本重构 | 第59-60页 |
3.3.3 基于蚁群算法的信息SNP子集构造 | 第60-63页 |
3.3.4 数据说明及评价指标 | 第63-64页 |
3.3.5 样本重构准确度 | 第64-66页 |
3.3.6 运行时间 | 第66-67页 |
3.3.7 信息SNP的关联研究效能 | 第67-68页 |
3.4 两种信息SNP选择算法区别及联系 | 第68-69页 |
3.5 小结 | 第69-70页 |
第4章 基于多次蚁群搜索框架的标签SNP选择方法 | 第70-86页 |
4.1 标签SNP与单体型关联研究 | 第70-71页 |
4.2 问题描述及定义 | 第71-72页 |
4.3 一种基于多次蚁群算法的标签SNP选择 | 第72-75页 |
4.3.1 多次蚁群算法搜索框架 | 第73页 |
4.3.2 路径选择及信息素更新策略 | 第73-75页 |
4.3.3 启发信息设计 | 第75页 |
4.4 算法描述 | 第75-78页 |
4.5 实验结果及讨论 | 第78-84页 |
4.5.1 实验数据集 | 第79-80页 |
4.5.2 模拟数据集上四种运行环境结果 | 第80-82页 |
4.5.3 真实数据集上实验结果 | 第82-83页 |
4.5.4 常见单体型不同比例识别 | 第83-84页 |
4.5.5 不同节点构造策略的稳定性 | 第84页 |
4.6 小结 | 第84-86页 |
第5章 统一信息SNP及标签SNP的核SNP选择方法 | 第86-106页 |
5.1 标签SNP与信息SNP之间的联系及区别 | 第86-87页 |
5.2 核SNP概念 | 第87-88页 |
5.3 基于层次聚类的核SNP选择方法 | 第88-95页 |
5.3.1 信息论 | 第88-90页 |
5.3.2 基于相对熵减少的多位点关联度量 | 第90-92页 |
5.3.3 凝聚层次聚类算法 | 第92-94页 |
5.3.4 核SNP选择 | 第94-95页 |
5.4 实验数据集及评价指标 | 第95-96页 |
5.5 实验结果 | 第96-104页 |
5.5.1 计算复杂度 | 第96-97页 |
5.5.2 参数θ设置 | 第97-99页 |
5.5.3 距离公式互反性讨论 | 第99-100页 |
5.5.4 核SNP的样本重构性能 | 第100-102页 |
5.5.5 核SNP的单体型覆盖率性能 | 第102页 |
5.5.6 等位基因频率和类簇分布 | 第102-104页 |
5.6 实验讨论 | 第104-105页 |
5.7 小结 | 第105-106页 |
第6章 基于最大一致最大差异准则的致病基因识别 | 第106-119页 |
6.1 复杂疾病关联研究 | 第106-107页 |
6.2 问题描述 | 第107页 |
6.3 最大一致性最大差异性准则 | 第107-108页 |
6.4 数据集及评价指标 | 第108-109页 |
6.5 乳腺癌数据集上位性分析 | 第109-113页 |
6.5.1 优化目标及优化算法 | 第109-110页 |
6.5.2 上位性分析实验结果 | 第110-111页 |
6.5.3 最大一致最大偏差性准则与最大偏差性准则比较 | 第111-112页 |
6.5.4 准确度评价 | 第112-113页 |
6.5.5 上位性实验讨论 | 第113页 |
6.6 乳腺癌数据集异质性分析 | 第113-118页 |
6.6.1 基于蚁群算法的异质性分析 | 第114页 |
6.6.2 异质性分析实验结果 | 第114-117页 |
6.6.3 异质性实验讨论 | 第117-118页 |
6.7 小结 | 第118-119页 |
结论 | 第119-122页 |
参考文献 | 第122-134页 |
致谢 | 第134-135页 |
附录A 攻读学位期间所发表的学术论文目录 | 第135-137页 |
附录B 攻读学位期间参与的项目 | 第137页 |