| 摘要 | 第3-5页 |
| Abstract | 第5-6页 |
| 注释表 | 第11-12页 |
| 第1章 绪论 | 第12-18页 |
| 1.1 课题背景和意义 | 第12-13页 |
| 1.2 海量蛋白质组数据所面临的问题 | 第13-14页 |
| 1.3 研究现状 | 第14-16页 |
| 1.4 课题的主要创新点 | 第16页 |
| 1.5 本文组织结构及章节安排 | 第16-18页 |
| 第2章 相关背景与关键技术介绍 | 第18-26页 |
| 2.1 蛋白质组数据 | 第18-21页 |
| 2.1.1 PRIDE | 第19-20页 |
| 2.1.2 Peptide Atlas | 第20页 |
| 2.1.3 Massive | 第20-21页 |
| 2.2 推荐系统 | 第21-23页 |
| 2.2.1 电子商务 | 第21-23页 |
| 2.2.2 科技文献 | 第23页 |
| 2.3 传统TF-IDF算法概述 | 第23-25页 |
| 2.3.1 TF-IDF算法背景知识 | 第23-24页 |
| 2.3.2 传统TF-IDF算法 | 第24-25页 |
| 2.4 本章小结 | 第25-26页 |
| 第3章 结合生物医学同义词和TF-IDF的文本相似度计算方法 | 第26-40页 |
| 3.1 蛋白质组学元数据 | 第26-28页 |
| 3.1.1 元数据简介 | 第26-27页 |
| 3.1.2 蛋白质组元数据 | 第27-28页 |
| 3.2 文本的相似度计算方法的概要 | 第28-30页 |
| 3.3 向量空间模型(VSM) | 第30页 |
| 3.4 TF-IDF算法的改进 | 第30-33页 |
| 3.5 数据的采集及处理 | 第33-36页 |
| 3.5.1 文本集的获取与预处理 | 第33-34页 |
| 3.5.2 生物医学领域同义词库的构建 | 第34-36页 |
| 3.6 算法的实现 | 第36-37页 |
| 3.7 生物医学文本相似度计算实验及结果分析 | 第37-39页 |
| 3.7.1 实验设计 | 第37-38页 |
| 3.7.2 结果分析 | 第38-39页 |
| 3.8 本章小结 | 第39-40页 |
| 第4章 基于分子证据的蛋白质组学数据相似性算法 | 第40-58页 |
| 4.1 蛋白质组学的分子证据 | 第40-41页 |
| 4.2 蛋白质组学数据 | 第41-42页 |
| 4.3 基于分子证据的蛋白质组学相似性算法 | 第42-46页 |
| 4.4 基于分子证据的蛋白质组学相似性算法实验及结果分析 | 第46-56页 |
| 4.4.1 数据的预处理 | 第46-48页 |
| 4.4.2 算法的实现 | 第48-49页 |
| 4.4.3 实验设计及结果分析 | 第49-56页 |
| 4.5 本章小结 | 第56-58页 |
| 第5章 总结及未来工作 | 第58-60页 |
| 5.1 本文总结 | 第58-59页 |
| 5.2 后续工作与未来的研究展望 | 第59-60页 |
| 参考文献 | 第60-65页 |
| 致谢 | 第65-66页 |
| 攻读硕士学位期间从事的科研工作及取得的成果 | 第66页 |