摘要 | 第5-8页 |
Abstract | 第8-10页 |
缩略词表 | 第16-18页 |
1 引言 | 第18-22页 |
2 实验对象和方法 | 第22-32页 |
2.1 实验对象 | 第22-23页 |
2.2 实验方法 | 第23-32页 |
2.2.1 转录组高通量测序数据的预处理 | 第23-24页 |
2.2.2 差异表达基因分析 | 第24页 |
2.2.3 加权基因共表达网络分析(WGCNA) | 第24-26页 |
2.2.4 基因本体富集分析和KEGG通路富集分析 | 第26-27页 |
2.2.5 NSCLC预测模型构建 | 第27-32页 |
3 实验结果 | 第32-63页 |
3.1 纳入本研究数据 | 第32-34页 |
3.2 RNA-seq原始计数数据处理 | 第34页 |
3.3 差异表达基因筛选 | 第34-36页 |
3.4 加权基因共表达网络分析 | 第36-47页 |
3.4.1 剔除离群样本 | 第37-39页 |
3.4.2 选择软阈值β | 第39-40页 |
3.4.3 一步法构建基因共表达网络 | 第40-42页 |
3.4.4 基因模块与临床信息关系分析 | 第42-46页 |
3.4.5 与NSCLC密切相关的枢纽基因 | 第46-47页 |
3.5 GO注释和KEGG通路富集分析 | 第47-55页 |
3.5.1 GO分类和富集分析结果 | 第48-51页 |
3.5.2 KEGG通路过代表分析和KEGG通路富集分析结果 | 第51-55页 |
3.6 预测模型构建 | 第55-63页 |
3.6.1 训练组和验证组数据 | 第55-57页 |
3.6.2 不同预测模型预测效果评价 | 第57-63页 |
4 讨论 | 第63-72页 |
4.1 常用肺癌肿瘤标志物应用及研究现状 | 第64-65页 |
4.2 差异表达基因分析鉴定出与多个NSCLC相关的重要基因家族 | 第65-67页 |
4.3 WGCNA鉴定出与NSCLC密切相关的基因模块 | 第67-68页 |
4.4 机器学习方法用于肿瘤预测模型构建可行 | 第68-70页 |
4.5 本研究的优点及局限性 | 第70-72页 |
5 结论 | 第72-73页 |
参考文献 | 第73-81页 |
综述 基因组学和转录组学在非小细胞肺癌中的研究和应用 | 第81-102页 |
1 引言 | 第81-83页 |
2 基因组学在非小细胞肺癌研究中的应用 | 第83-89页 |
2.1 基因组学介绍 | 第83-84页 |
2.2 基因组学在非小细胞肺癌中的应用 | 第84-89页 |
3 转录组学在非小细胞肺癌研究中的应用 | 第89-93页 |
3.1 转录组学介绍 | 第89-90页 |
3.2 转录组学在非小细胞肺癌中的应用 | 第90-93页 |
4 后基因组时代机器学习在肿瘤诊断研究中的应用 | 第93-94页 |
5 结论 | 第94-95页 |
参考文献 | 第95-102页 |
附录 | 第102-150页 |
附录A 本研究使用软件安装及纳入研究RNA-seq数据下载 | 第102-107页 |
附录B 差异表达基因分析R代码 | 第107-115页 |
附录C WGCNA分析、GO和KEGG富集分析R代码 | 第115-137页 |
附录C.1 WGCNA分析R代码 | 第115-128页 |
附录C.2 宝石绿基因GO和KEGG富集分析R代码 | 第128-137页 |
附录D 构建NSCLC预测模型R代码 | 第137-150页 |
个人简历 | 第150-151页 |
在学期间发表的学术论文与研究成果 | 第151-153页 |
致谢 | 第153页 |