摘要 | 第1-6页 |
Abstract | 第6-8页 |
目录 | 第8-10页 |
第一章 引言 | 第10-30页 |
第一节 研究背景 | 第10-28页 |
·生物信息学简介 | 第10-13页 |
·突变的生物学背景 | 第13-24页 |
·突变的生物信息学研究内容与现状 | 第24-28页 |
第二节 研究目的、意义与论文内容安排 | 第28-30页 |
·研究目的 | 第28页 |
·研究意义 | 第28页 |
·论文内容安排及说明 | 第28-30页 |
第二章 HERG模型与突变数据库研究 | 第30-53页 |
第一节 人类变异组计划及其进展 | 第30-38页 |
·人类变异组计划的历史与背景 | 第30-31页 |
·人类变异组计划的主要内容 | 第31-36页 |
·人类变异组计划的主要进展 | 第36-37页 |
·小结 | 第37-38页 |
第二节 突变数据库的整合与标准化 | 第38-45页 |
·突变数据库的简单分类 | 第38-40页 |
·突变数据库整合的目标 | 第40-42页 |
·异种数据库的整合方式 | 第42-44页 |
·突变数据库整合与标准化的关系 | 第44-45页 |
第三节 HERG模型及在分子生物学数据库标准化中的作用 | 第45-52页 |
·当前主要的数据模型 | 第45-46页 |
·HERG模型 | 第46-49页 |
·HERG模型的简单应用 | 第49-52页 |
本章发表的论文 | 第52-53页 |
第三章 基于打分矩阵内核的SVM预测蛋白质点突变效果 | 第53-78页 |
第一节 基于序列的机器学习预测方法 | 第53-56页 |
·蛋白质序列的采样 | 第53-54页 |
·样本的特征提取与编码 | 第54-55页 |
·特征选择 | 第55-56页 |
第二节 分类/预测的性能评价 | 第56-63页 |
·数据集的划分与验证方法 | 第56-58页 |
·性能度量指标 | 第58-63页 |
第三节 基于打分矩阵内核的支持向量机 | 第63-68页 |
·支持向量机算法的主要特点 | 第63-64页 |
·核函数的构造与模型选择 | 第64-65页 |
·基于打分矩阵的核函数 | 第65-68页 |
第四节 三种支持向量机预测蛋白质点突变效果 | 第68-73页 |
·数据预处理与正负样本定义 | 第68页 |
·三种支持向量机 | 第68-70页 |
·主要结果 | 第70-72页 |
·应用举例 | 第72-73页 |
第五节 讨论 | 第73-77页 |
·打分矩阵核函数的理论基础 | 第73-74页 |
·打分矩阵核函数的信息论解释 | 第74-76页 |
·基于序列的保守性信息的应用 | 第76页 |
·训练集与测试集的划分 | 第76-77页 |
本章发表的论文 | 第77-78页 |
第四章 结论与展望 | 第78-84页 |
第一节 全文结论及存在问题 | 第78-80页 |
·HERG模型与突变数据库研究方面 | 第78页 |
·蛋白质点突变效果预测方面 | 第78-80页 |
第二节 创新点 | 第80-81页 |
第三节 未来工作 | 第81-84页 |
·HERG模型与突变数据库研究方面 | 第81页 |
·蛋白质点突变效果预测方面 | 第81-84页 |
参考文献 | 第84-94页 |
致谢 | 第94-95页 |
附录及附表 | 第95-120页 |
附录A 机器学习与支持向量机简介 | 第95-103页 |
一、什么是机器学习 | 第95页 |
二、机器学习的主要类别 | 第95-97页 |
三、支持向量机与两分类问题 | 第97-100页 |
四、统计学习理论 | 第100-103页 |
附录B 典型的综合性突变数据库介绍 | 第103-109页 |
一、人类基因突变数据库 | 第103-105页 |
二、PMD数据库 | 第105-107页 |
三、SNPeffect数据库 | 第107-109页 |
附录C HERG模型的XML Schema文件 | 第109-120页 |
附表1 本文2.3.3中用到的132个数据库 | 第115-120页 |
一、实际用于统计的99个数据库 | 第115-118页 |
二、已经废弃的33个数据库 | 第118-120页 |
个人简历、在学期间发表的学术论文与研究成果 | 第120-121页 |
个人简历 | 第120页 |
博士期间发表的文章 | 第120-121页 |
SCI收录(4篇) | 第120页 |
EI收录(2篇) | 第120-121页 |
核心期刊(3篇) | 第121页 |
在投(2篇) | 第121页 |