摘要 | 第3-5页 |
Abstract | 第5-6页 |
注释表 | 第11-12页 |
第1章 绪论 | 第12-18页 |
1.1 课题背景和意义 | 第12-13页 |
1.2 海量蛋白质组数据所面临的问题 | 第13-14页 |
1.3 研究现状 | 第14-16页 |
1.4 课题的主要创新点 | 第16页 |
1.5 本文组织结构及章节安排 | 第16-18页 |
第2章 相关背景与关键技术介绍 | 第18-26页 |
2.1 蛋白质组数据 | 第18-21页 |
2.1.1 PRIDE | 第19-20页 |
2.1.2 Peptide Atlas | 第20页 |
2.1.3 Massive | 第20-21页 |
2.2 推荐系统 | 第21-23页 |
2.2.1 电子商务 | 第21-23页 |
2.2.2 科技文献 | 第23页 |
2.3 传统TF-IDF算法概述 | 第23-25页 |
2.3.1 TF-IDF算法背景知识 | 第23-24页 |
2.3.2 传统TF-IDF算法 | 第24-25页 |
2.4 本章小结 | 第25-26页 |
第3章 结合生物医学同义词和TF-IDF的文本相似度计算方法 | 第26-40页 |
3.1 蛋白质组学元数据 | 第26-28页 |
3.1.1 元数据简介 | 第26-27页 |
3.1.2 蛋白质组元数据 | 第27-28页 |
3.2 文本的相似度计算方法的概要 | 第28-30页 |
3.3 向量空间模型(VSM) | 第30页 |
3.4 TF-IDF算法的改进 | 第30-33页 |
3.5 数据的采集及处理 | 第33-36页 |
3.5.1 文本集的获取与预处理 | 第33-34页 |
3.5.2 生物医学领域同义词库的构建 | 第34-36页 |
3.6 算法的实现 | 第36-37页 |
3.7 生物医学文本相似度计算实验及结果分析 | 第37-39页 |
3.7.1 实验设计 | 第37-38页 |
3.7.2 结果分析 | 第38-39页 |
3.8 本章小结 | 第39-40页 |
第4章 基于分子证据的蛋白质组学数据相似性算法 | 第40-58页 |
4.1 蛋白质组学的分子证据 | 第40-41页 |
4.2 蛋白质组学数据 | 第41-42页 |
4.3 基于分子证据的蛋白质组学相似性算法 | 第42-46页 |
4.4 基于分子证据的蛋白质组学相似性算法实验及结果分析 | 第46-56页 |
4.4.1 数据的预处理 | 第46-48页 |
4.4.2 算法的实现 | 第48-49页 |
4.4.3 实验设计及结果分析 | 第49-56页 |
4.5 本章小结 | 第56-58页 |
第5章 总结及未来工作 | 第58-60页 |
5.1 本文总结 | 第58-59页 |
5.2 后续工作与未来的研究展望 | 第59-60页 |
参考文献 | 第60-65页 |
致谢 | 第65-66页 |
攻读硕士学位期间从事的科研工作及取得的成果 | 第66页 |