基于机器学习方法的生物序列分类研究
| 摘要 | 第1-8页 |
| ABSTRACT | 第8-13页 |
| 主要符号对照表 | 第13-14页 |
| 第一章 绪论 | 第14-28页 |
| ·课题背景及意义 | 第14-16页 |
| ·机器学习算法 | 第16-21页 |
| ·神经网络 | 第16-17页 |
| ·支持向量机 | 第17-20页 |
| ·决策树 | 第20-21页 |
| ·K近邻法 | 第21页 |
| ·蛋白质序列特征提取和分类 | 第21-26页 |
| ·核酸序列分类 | 第26-27页 |
| ·论文安排 | 第27-28页 |
| 第二章 蛋白质序列特征提取 | 第28-58页 |
| ·基于序列的传统特征提取方法 | 第28-32页 |
| ·氨基酸组份方法 | 第28-29页 |
| ·k联体方法 | 第29-32页 |
| ·基于注释的特征提取方法 | 第32-33页 |
| ·基因本体(Gene Ontology) | 第32-33页 |
| ·GO特征提取方法 | 第33页 |
| ·模体特征提取方法 | 第33页 |
| ·基于中文分词技术的特征提取 | 第33-38页 |
| ·建立词汇表 | 第35-37页 |
| ·分词 | 第37-38页 |
| ·基于其他信息的特征提取 | 第38-41页 |
| ·蛋白质亚细胞定位预测实验 | 第41-47页 |
| ·基于分词特征的预测结果 | 第42-46页 |
| ·每种长度的词个数 | 第42页 |
| ·最大词长度 | 第42-46页 |
| ·与其他方法的比较 | 第46-47页 |
| ·蛋白质同源家族分类实验 | 第47-52页 |
| ·SCOP家族分类实验 | 第48-51页 |
| ·GPCR蛋白质亚家族分类 | 第51-52页 |
| ·细菌Ⅲ型分泌系统效应蛋白预测 | 第52-56页 |
| ·数据集 | 第53-54页 |
| ·实验结果 | 第54-56页 |
| ·本章小结 | 第56-58页 |
| 第三章 基于M~3-SVM的蛋白质亚细胞定位 | 第58-77页 |
| ·研究现状 | 第58-60页 |
| ·最小最大模块化网络 | 第60-67页 |
| ·将多类问题分解为二类问题 | 第60-62页 |
| ·进一步分解二类问题 | 第62页 |
| ·合并子问题 | 第62-64页 |
| ·将二类问题还原为多类问题 | 第64页 |
| ·多标号问题的分类 | 第64-66页 |
| ·任务分解 | 第66-67页 |
| ·实验结果与讨论 | 第67-76页 |
| ·实验一 | 第67-71页 |
| ·实验二 | 第71-74页 |
| ·响应时间比较 | 第74-76页 |
| ·本章小结 | 第76-77页 |
| 第四章 基于领域知识的问题分解 | 第77-96页 |
| ·问题分解的重要性 | 第77-79页 |
| ·随机分解 | 第79-80页 |
| ·超平面分解 | 第80-81页 |
| ·PCA超平面分解 | 第81-82页 |
| ·基于均等聚类的问题分解 | 第82-84页 |
| ·根据领域知识的问题分解 | 第84-86页 |
| ·基于生物种属关系的分解策略 | 第84-85页 |
| ·基于基因本体的样本划分 | 第85-86页 |
| ·实验结果 | 第86-95页 |
| ·基于物种信息分解的实验结果 | 第86-89页 |
| ·几种分解策略的比较 | 第89-90页 |
| ·基于GO分解的实验结果 | 第90-93页 |
| ·与其他方法的比较 | 第93-95页 |
| ·本章小结 | 第95-96页 |
| 第五章 非编码RNA预测 | 第96-111页 |
| ·非编码RNA简介 | 第96-97页 |
| ·实验数据来源 | 第97-98页 |
| ·计算预测流程 | 第98-101页 |
| ·生成保守区段 | 第99-100页 |
| ·RNA预测工具 | 第100-101页 |
| ·性能评估 | 第101-102页 |
| ·查全率 | 第101页 |
| ·查准率 | 第101-102页 |
| ·实验结果 | 第102-109页 |
| ·预测拟南芥ncRNA | 第102-104页 |
| ·根据已知基因和ncRNA筛选 | 第104-105页 |
| ·预测结果与TAIR8注释匹配 | 第104页 |
| ·预测结果与已知ncRNA数据库匹配 | 第104-105页 |
| ·使用Rfam分类可能的ncRNA | 第105页 |
| ·湿实验验证 | 第105页 |
| ·与APP三元组结果的比较 | 第105-106页 |
| ·进一步的结果分析 | 第106-109页 |
| ·蛋白质编码能力检查 | 第107-109页 |
| ·检查包含小RNA的情况 | 第109页 |
| ·识别重复序列和转座子 | 第109页 |
| ·本章小结 | 第109-111页 |
| 第六章 总结与展望 | 第111-114页 |
| 参考文献 | 第114-125页 |
| 致谢 | 第125-126页 |
| 个人简历、在学期间的研究成果及发表的论文 | 第126-127页 |