| 提要 | 第4-5页 |
| 摘要 | 第5-8页 |
| Abstract | 第8-10页 |
| 第1章 绪论 | 第14-18页 |
| 1.1 本文的目的和意义 | 第14页 |
| 1.2 基因芯片技术的主要应用领域 | 第14-16页 |
| 1.3 本文的主要工作 | 第16页 |
| 1.4 本文的结构 | 第16-18页 |
| 第2章 生物信息学背景介绍 | 第18-30页 |
| 2.1 生物信息学概述 | 第18-23页 |
| 2.1.1 生物信息学的研究对象 | 第18-21页 |
| 2.1.2 生物信息学的研究领域 | 第21-23页 |
| 2.2 基因芯片 | 第23-29页 |
| 2.2.1 基因表达 | 第24-25页 |
| 2.2.2 基因表达水平检测技术 | 第25-26页 |
| 2.2.3 cDNA芯片 | 第26-27页 |
| 2.2.4 寡核苷酸芯片 | 第27-28页 |
| 2.2.5 cDNA芯片与寡核苷酸芯片的区别 | 第28-29页 |
| 2.3 小结 | 第29-30页 |
| 第3章 基于数据扰动的基因表达数据中的误标记样本检测算法 | 第30-63页 |
| 3.1 引言 | 第30-37页 |
| 3.1.1 基因表达数据中的误标记样本 | 第30-32页 |
| 3.1.2 基于LOOPC矩阵的误标记样本检测方法 | 第32-37页 |
| 3.2 扰动影响值 | 第37-40页 |
| 3.2.1 回归模型的建立 | 第37-38页 |
| 3.2.2 扰动影响值 | 第38-39页 |
| 3.2.3 扰动影响矩阵 | 第39-40页 |
| 3.3 基于扰动影响值的列算法 | 第40-42页 |
| 3.3.1 总体扰动影响值 | 第40-41页 |
| 3.3.2 列算法 | 第41-42页 |
| 3.4 基于扰动影响值的行算法 | 第42-44页 |
| 3.4.1 综合扰动影响值 | 第42-43页 |
| 3.4.2 行算法 | 第43-44页 |
| 3.5 行算法中的阈值调整 | 第44-47页 |
| 3.5.1 行算法的缺陷分析 | 第44页 |
| 3.5.2 阈值调整 | 第44-47页 |
| 3.6 渐进修正的行算法 | 第47-50页 |
| 3.6.1 渐进修正的基本思想 | 第47-48页 |
| 3.6.2 待修正样本的选取 | 第48页 |
| 3.6.3 渐进算法设计 | 第48-50页 |
| 3.7 实验测试与分析 | 第50-62页 |
| 3.7.1 测试数据集说明 | 第50-51页 |
| 3.7.2 测试指标说明 | 第51-52页 |
| 3.7.3 实验结果分析 | 第52-62页 |
| 3.8 小结 | 第62-63页 |
| 第4章 基因表达数据中的差异表达基因识别 | 第63-84页 |
| 4.1 引言 | 第63-67页 |
| 4.1.1 差异表达基因检测概述 | 第63-64页 |
| 4.1.2 ttest方法 | 第64-65页 |
| 4.1.3 SAM方法 | 第65-66页 |
| 4.1.4 RankProd方法 | 第66-67页 |
| 4.2 传统方法的不足 | 第67页 |
| 4.3 基因的表达变化量 | 第67-72页 |
| 4.3.1 基因芯片数据集的数学描述 | 第68页 |
| 4.3.2 传统的表达变化系数 | 第68-71页 |
| 4.3.3 与类别无关的表达变化系数 | 第71页 |
| 4.3.4 基于平均绝对差(MAD)的表达变化系数 | 第71-72页 |
| 4.4 总体数据集变化量统计评估 | 第72-74页 |
| 4.4.1 总体分布法(Distribution) | 第73页 |
| 4.4.2 总体界外值法(Outlier) | 第73页 |
| 4.4.3 总体permutation法 | 第73-74页 |
| 4.5 实验测试与分析 | 第74-83页 |
| 4.5.1 实验数据集说明 | 第74-76页 |
| 4.5.2 实验结果分析 | 第76-83页 |
| 4.6 小结 | 第83-84页 |
| 第5章 结论与展望 | 第84-86页 |
| 5.1 研究总结 | 第84-85页 |
| 5.2 未来研究展望 | 第85-86页 |
| 参考文献 | 第86-93页 |
| 作者简介及在学期间所取得的科研成果 | 第93-95页 |
| 致谢 | 第95页 |