目录 | 第1-6页 |
摘要 | 第6-8页 |
Abstract | 第8-11页 |
第一章 基于机器学习方法建立蛋白质结构域与配体相互作用的预测系统 | 第11-76页 |
·前言 | 第12-15页 |
·材料与方法 | 第15-25页 |
·结构域三维结构的收集和相互作用接触面(interface)位点的选取 | 第15-19页 |
·相互作用数据的收集 | 第19页 |
·相互作用的多肽序列的表示 | 第19-20页 |
·两种机器学习算法 | 第20-22页 |
·预测效果的评价 | 第22页 |
·三种预测方法的整合 | 第22-23页 |
·体外高通量筛选相互作用实验数据的获得 | 第23页 |
·酵母双杂交方法筛选随机多肽库的实验数据获得 | 第23-25页 |
·结果与讨论 | 第25-36页 |
·模型的建立 | 第25-26页 |
·预测系统的特异性——从蛋白质数据库中筛选结构域结合的配体并与实验结果比较 | 第26-29页 |
·预测系统的灵敏度——与酵母双杂交筛选随机多肽库的结果比较 | 第29页 |
·对新类别配体的预测 | 第29-30页 |
·从交叉验证结果估计预测系统筛库的精确度(Estimated Screening Precision) | 第30-34页 |
·从配体蛋白的序列预测可能结合的结构域 | 第34页 |
·讨论:应用机器学习方法解决生物学问题 | 第34-35页 |
·讨论(2) | 第35-36页 |
·结论 | 第36-37页 |
参考文献 | 第37-41页 |
附录 | 第41-76页 |
附表1:613个PDZ结构域上参与相互作用的氨基酸残基 | 第41-61页 |
附表2:学习集的338对相互作用 | 第61-72页 |
附表3:Erbin PDZ结构域结合配体 | 第72-73页 |
附表4:三个PDZ结构域结合配体的预测结果 | 第73-76页 |
第二章 应用Logistic回归提高串联质谱鉴定多肽的准确度 | 第76-100页 |
·前言 | 第77-79页 |
·材料与方法 | 第79-84页 |
·MS/MS实验数据的获得 | 第79-80页 |
·利用SEQUEST软件进行数据库检索 | 第80-82页 |
·Logistic回归模型 | 第82-83页 |
·本文使用的统计方法 | 第83-84页 |
·结果 | 第84-95页 |
·模型的建立 | 第84-88页 |
·Oscore在标准蛋白数据集上的表现 | 第88-90页 |
·Oscore在蛋白质组水平的复杂数据集上的表现 | 第90-92页 |
·Oscore比PeptideProphet具有更好表现的原因探讨 | 第92-93页 |
·鉴定非完全酶切的多肽的尝试 | 第93-95页 |
·讨论 | 第95-96页 |
·结论 | 第96-97页 |
参考文献 | 第97-100页 |
综述 应用计算方法预测蛋白质相互作用的研究进展 | 第100-111页 |
个人简历 | 第111-112页 |
在读期间学术成果 | 第112-113页 |
致谢 | 第113-114页 |
发表论文 | 第114-131页 |