基于机器学习方法的生物序列分类研究
摘要 | 第1-8页 |
ABSTRACT | 第8-13页 |
主要符号对照表 | 第13-14页 |
第一章 绪论 | 第14-28页 |
·课题背景及意义 | 第14-16页 |
·机器学习算法 | 第16-21页 |
·神经网络 | 第16-17页 |
·支持向量机 | 第17-20页 |
·决策树 | 第20-21页 |
·K近邻法 | 第21页 |
·蛋白质序列特征提取和分类 | 第21-26页 |
·核酸序列分类 | 第26-27页 |
·论文安排 | 第27-28页 |
第二章 蛋白质序列特征提取 | 第28-58页 |
·基于序列的传统特征提取方法 | 第28-32页 |
·氨基酸组份方法 | 第28-29页 |
·k联体方法 | 第29-32页 |
·基于注释的特征提取方法 | 第32-33页 |
·基因本体(Gene Ontology) | 第32-33页 |
·GO特征提取方法 | 第33页 |
·模体特征提取方法 | 第33页 |
·基于中文分词技术的特征提取 | 第33-38页 |
·建立词汇表 | 第35-37页 |
·分词 | 第37-38页 |
·基于其他信息的特征提取 | 第38-41页 |
·蛋白质亚细胞定位预测实验 | 第41-47页 |
·基于分词特征的预测结果 | 第42-46页 |
·每种长度的词个数 | 第42页 |
·最大词长度 | 第42-46页 |
·与其他方法的比较 | 第46-47页 |
·蛋白质同源家族分类实验 | 第47-52页 |
·SCOP家族分类实验 | 第48-51页 |
·GPCR蛋白质亚家族分类 | 第51-52页 |
·细菌Ⅲ型分泌系统效应蛋白预测 | 第52-56页 |
·数据集 | 第53-54页 |
·实验结果 | 第54-56页 |
·本章小结 | 第56-58页 |
第三章 基于M~3-SVM的蛋白质亚细胞定位 | 第58-77页 |
·研究现状 | 第58-60页 |
·最小最大模块化网络 | 第60-67页 |
·将多类问题分解为二类问题 | 第60-62页 |
·进一步分解二类问题 | 第62页 |
·合并子问题 | 第62-64页 |
·将二类问题还原为多类问题 | 第64页 |
·多标号问题的分类 | 第64-66页 |
·任务分解 | 第66-67页 |
·实验结果与讨论 | 第67-76页 |
·实验一 | 第67-71页 |
·实验二 | 第71-74页 |
·响应时间比较 | 第74-76页 |
·本章小结 | 第76-77页 |
第四章 基于领域知识的问题分解 | 第77-96页 |
·问题分解的重要性 | 第77-79页 |
·随机分解 | 第79-80页 |
·超平面分解 | 第80-81页 |
·PCA超平面分解 | 第81-82页 |
·基于均等聚类的问题分解 | 第82-84页 |
·根据领域知识的问题分解 | 第84-86页 |
·基于生物种属关系的分解策略 | 第84-85页 |
·基于基因本体的样本划分 | 第85-86页 |
·实验结果 | 第86-95页 |
·基于物种信息分解的实验结果 | 第86-89页 |
·几种分解策略的比较 | 第89-90页 |
·基于GO分解的实验结果 | 第90-93页 |
·与其他方法的比较 | 第93-95页 |
·本章小结 | 第95-96页 |
第五章 非编码RNA预测 | 第96-111页 |
·非编码RNA简介 | 第96-97页 |
·实验数据来源 | 第97-98页 |
·计算预测流程 | 第98-101页 |
·生成保守区段 | 第99-100页 |
·RNA预测工具 | 第100-101页 |
·性能评估 | 第101-102页 |
·查全率 | 第101页 |
·查准率 | 第101-102页 |
·实验结果 | 第102-109页 |
·预测拟南芥ncRNA | 第102-104页 |
·根据已知基因和ncRNA筛选 | 第104-105页 |
·预测结果与TAIR8注释匹配 | 第104页 |
·预测结果与已知ncRNA数据库匹配 | 第104-105页 |
·使用Rfam分类可能的ncRNA | 第105页 |
·湿实验验证 | 第105页 |
·与APP三元组结果的比较 | 第105-106页 |
·进一步的结果分析 | 第106-109页 |
·蛋白质编码能力检查 | 第107-109页 |
·检查包含小RNA的情况 | 第109页 |
·识别重复序列和转座子 | 第109页 |
·本章小结 | 第109-111页 |
第六章 总结与展望 | 第111-114页 |
参考文献 | 第114-125页 |
致谢 | 第125-126页 |
个人简历、在学期间的研究成果及发表的论文 | 第126-127页 |