机器学习方法预测蛋白质相互作用应用Logistic回归提高质谱多肽鉴定的准确度

目录	第1-6页
摘要	第6-8页
Abstract	第8-11页
第一章基于机器学习方法建立蛋白质结构域与配体相互作用的预测系统	第11-76页
·前言	第12-15页
·材料与方法	第15-25页
·结构域三维结构的收集和相互作用接触面(interface)位点的选取	第15-19页
·相互作用数据的收集	第19页
·相互作用的多肽序列的表示	第19-20页
·两种机器学习算法	第20-22页
·预测效果的评价	第22页
·三种预测方法的整合	第22-23页
·体外高通量筛选相互作用实验数据的获得	第23页
·酵母双杂交方法筛选随机多肽库的实验数据获得	第23-25页
·结果与讨论	第25-36页
·模型的建立	第25-26页
·预测系统的特异性——从蛋白质数据库中筛选结构域结合的配体并与实验结果比较	第26-29页
·预测系统的灵敏度——与酵母双杂交筛选随机多肽库的结果比较	第29页
·对新类别配体的预测	第29-30页
·从交叉验证结果估计预测系统筛库的精确度(Estimated Screening Precision)	第30-34页
·从配体蛋白的序列预测可能结合的结构域	第34页
·讨论:应用机器学习方法解决生物学问题	第34-35页
·讨论(2)	第35-36页
·结论	第36-37页
参考文献	第37-41页
附录	第41-76页
附表1:613个PDZ结构域上参与相互作用的氨基酸残基	第41-61页
附表2:学习集的338对相互作用	第61-72页
附表3:Erbin PDZ结构域结合配体	第72-73页
附表4:三个PDZ结构域结合配体的预测结果	第73-76页
第二章应用Logistic回归提高串联质谱鉴定多肽的准确度	第76-100页
·前言	第77-79页
·材料与方法	第79-84页
·MS/MS实验数据的获得	第79-80页
·利用SEQUEST软件进行数据库检索	第80-82页
·Logistic回归模型	第82-83页
·本文使用的统计方法	第83-84页
·结果	第84-95页
·模型的建立	第84-88页
·Oscore在标准蛋白数据集上的表现	第88-90页
·Oscore在蛋白质组水平的复杂数据集上的表现	第90-92页
·Oscore比PeptideProphet具有更好表现的原因探讨	第92-93页
·鉴定非完全酶切的多肽的尝试	第93-95页
·讨论	第95-96页
·结论	第96-97页
参考文献	第97-100页
综述应用计算方法预测蛋白质相互作用的研究进展	第100-111页
个人简历	第111-112页
在读期间学术成果	第112-113页
致谢	第113-114页
发表论文	第114-131页