| 目录 | 第1-6页 |
| 摘要 | 第6-8页 |
| Abstract | 第8-11页 |
| 第一章 基于机器学习方法建立蛋白质结构域与配体相互作用的预测系统 | 第11-76页 |
| ·前言 | 第12-15页 |
| ·材料与方法 | 第15-25页 |
| ·结构域三维结构的收集和相互作用接触面(interface)位点的选取 | 第15-19页 |
| ·相互作用数据的收集 | 第19页 |
| ·相互作用的多肽序列的表示 | 第19-20页 |
| ·两种机器学习算法 | 第20-22页 |
| ·预测效果的评价 | 第22页 |
| ·三种预测方法的整合 | 第22-23页 |
| ·体外高通量筛选相互作用实验数据的获得 | 第23页 |
| ·酵母双杂交方法筛选随机多肽库的实验数据获得 | 第23-25页 |
| ·结果与讨论 | 第25-36页 |
| ·模型的建立 | 第25-26页 |
| ·预测系统的特异性——从蛋白质数据库中筛选结构域结合的配体并与实验结果比较 | 第26-29页 |
| ·预测系统的灵敏度——与酵母双杂交筛选随机多肽库的结果比较 | 第29页 |
| ·对新类别配体的预测 | 第29-30页 |
| ·从交叉验证结果估计预测系统筛库的精确度(Estimated Screening Precision) | 第30-34页 |
| ·从配体蛋白的序列预测可能结合的结构域 | 第34页 |
| ·讨论:应用机器学习方法解决生物学问题 | 第34-35页 |
| ·讨论(2) | 第35-36页 |
| ·结论 | 第36-37页 |
| 参考文献 | 第37-41页 |
| 附录 | 第41-76页 |
| 附表1:613个PDZ结构域上参与相互作用的氨基酸残基 | 第41-61页 |
| 附表2:学习集的338对相互作用 | 第61-72页 |
| 附表3:Erbin PDZ结构域结合配体 | 第72-73页 |
| 附表4:三个PDZ结构域结合配体的预测结果 | 第73-76页 |
| 第二章 应用Logistic回归提高串联质谱鉴定多肽的准确度 | 第76-100页 |
| ·前言 | 第77-79页 |
| ·材料与方法 | 第79-84页 |
| ·MS/MS实验数据的获得 | 第79-80页 |
| ·利用SEQUEST软件进行数据库检索 | 第80-82页 |
| ·Logistic回归模型 | 第82-83页 |
| ·本文使用的统计方法 | 第83-84页 |
| ·结果 | 第84-95页 |
| ·模型的建立 | 第84-88页 |
| ·Oscore在标准蛋白数据集上的表现 | 第88-90页 |
| ·Oscore在蛋白质组水平的复杂数据集上的表现 | 第90-92页 |
| ·Oscore比PeptideProphet具有更好表现的原因探讨 | 第92-93页 |
| ·鉴定非完全酶切的多肽的尝试 | 第93-95页 |
| ·讨论 | 第95-96页 |
| ·结论 | 第96-97页 |
| 参考文献 | 第97-100页 |
| 综述 应用计算方法预测蛋白质相互作用的研究进展 | 第100-111页 |
| 个人简历 | 第111-112页 |
| 在读期间学术成果 | 第112-113页 |
| 致谢 | 第113-114页 |
| 发表论文 | 第114-131页 |