论文摘要 | 第1-7页 |
ABSTRACT | 第7-12页 |
第一章 :背景介绍 | 第12-23页 |
·引言 | 第12页 |
·蛋白质组学 | 第12-14页 |
·蛋白质组学研究的主要的技术手段 | 第14-16页 |
·双向凝胶电泳 | 第14-15页 |
·串联质谱技术 | 第15-16页 |
·蛋白质芯片 | 第16页 |
·蛋白质组学的未来趋势 | 第16页 |
·贝叶斯方法简介 | 第16-23页 |
·贝叶斯的起源 | 第17页 |
·贝叶斯方法简述 | 第17-20页 |
·贝叶斯的计算方法 | 第20-21页 |
·贝叶斯方法在生物信息学中应用 | 第21-23页 |
第二章 :蛋白质质谱分析流程 | 第23-31页 |
·蛋白质质谱中应用的主要技术 | 第23-27页 |
·酶切 | 第23-24页 |
·色谱技术 | 第24页 |
·离子化的方法 | 第24-26页 |
·裂解技术 | 第26-27页 |
·质谱的种类 | 第27-29页 |
·单独质谱 | 第27-28页 |
·质谱联用 | 第28-29页 |
·蛋白质质谱分析的主要应用 | 第29-31页 |
·蛋白质的定性分析 | 第29-30页 |
·蛋白质的定量分析 | 第30-31页 |
第三章 :目前主要的质谱分析软件以及算法 | 第31-50页 |
·蛋白质定性分析算法 | 第31-42页 |
·搜索数据库算法 | 第32-39页 |
·重测序算法 | 第39-41页 |
·重测序和搜索数据库的方法相结合 | 第41-42页 |
·定量分析算法 | 第42-45页 |
·基于荧光标记的双向凝胶电泳技术 | 第42-43页 |
·同位素标记方法 | 第43-44页 |
·无标记定量技术 | 第44-45页 |
·蛋白质芯片技术 | 第45页 |
·寻找翻译后修饰算法 | 第45-50页 |
·基于蛋白质位置特异性权重矩阵 | 第46页 |
·基于隐马尔科夫模型 | 第46-47页 |
·基于机器学习的方法 | 第47-48页 |
·基于质谱联配的方法 | 第48-50页 |
第四章 :基于机器学习和贝叶斯方法的蛋白质鉴定算法 | 第50-64页 |
·选用的方法 | 第50-56页 |
·分类器算法 | 第50-56页 |
·朴素贝叶斯 | 第56页 |
·算法流程及结果 | 第56-64页 |
·训练数据 | 第57页 |
·挑选特征训练分类器 | 第57页 |
·分布拟合以及贝叶斯计算 | 第57-58页 |
·结果对比 | 第58-64页 |
第五章 :基于聚类分析的蛋白质翻译后修饰识别算法 | 第64-77页 |
·常见的翻译后修饰的种类以及功能 | 第64-65页 |
·聚类方法简介 | 第65-72页 |
·距离的定义 | 第65-67页 |
·常用聚类算法 | 第67-69页 |
·未知类数目时确定类数目的一些方法 | 第69-72页 |
·算法流程 | 第72-74页 |
·算法基本流程 | 第72页 |
·特征的选取 | 第72-73页 |
·计算距离的方法 | 第73页 |
·新数据的聚类分析和翻译后修饰预测 | 第73-74页 |
·实验结果 | 第74-77页 |
·阴阳极数据的生成 | 第74页 |
·计算投影方向 | 第74-75页 |
·结果 | 第75-77页 |
第六章 :人类蛋白质组数据分析 | 第77-86页 |
·数据来源 | 第77页 |
·TPP鉴定结果 | 第77-86页 |
·TPP的分析流程 | 第77-78页 |
·鉴定到的蛋白质 | 第78-81页 |
·蛋白质表达的分析 | 第81-86页 |
第七章 :基于云计算的蛋白质质谱数据分析 | 第86-91页 |
·云计算框架简介 | 第86-89页 |
·Google File System(GFS) | 第87页 |
·MapReduce | 第87-88页 |
·BigTable | 第88-89页 |
·Hadoop和Mahout | 第89页 |
·基于云计算的质谱分析策略 | 第89-91页 |
第八章 :结论 | 第91-92页 |
附录 | 第92-111页 |
附录1:各种离散分布的先验分布以及先验和后验的超参数 | 第92-93页 |
附录2:各种连续分布的先验分布以及先验和后验的超参数 | 第93-95页 |
附录3:常见的20种氨基酸 | 第95-96页 |
附录4:13组数据对应质谱分批数据和文章 | 第96-97页 |
附录5:13组数据的平台详细信息 | 第97-98页 |
附录6:31组实验对应的序列标签 | 第98-99页 |
附录7:62组实验对应的序列标签 | 第99-100页 |
附录8:Native Method下的重合度(坐标见附录6) | 第100-101页 |
附录9:Native Method下的Heatmap(坐标见附录6) | 第101-102页 |
附录10:Native和K-score混合下的重合度(坐标见附录7) | 第102-103页 |
附录11:Native和K-score混合下的Heatmap(坐标见附录7) | 第103-104页 |
附录12:18种蛋白的混合成分 | 第104-105页 |
附录13:Hadoop家族主要子项目 | 第105-106页 |
附录14:TPP中包含的软件 | 第106-107页 |
附录15:各组实验检测蛋白的相似得分的图,罚值为相似性得分大于0.8,中间方形内节点的度数大于5,外圈的则小于等于5 | 第107-108页 |
附录16:各组实验检测蛋白的相似得分的图,罚值为相似性得分大于0.7,中间方形内节点的度数大于12,外圈的则小于等于12 | 第108-109页 |
附录17:各组实验检测蛋白的相似得分的图,罚值为相似性得分大于0.6,中间方形内节点的度数大于17,外圈的则小于等于17 | 第109-110页 |
附录18:攻读学位期间发表的与学位相关的学术论文 | 第110-111页 |
参考文献 | 第111-117页 |
后记 | 第117页 |