蛋白质组学数据的相似性计算方法研究

摘要	第3-5页
Abstract	第5-6页
注释表	第11-12页
第1章绪论	第12-18页
1.1 课题背景和意义	第12-13页
1.2 海量蛋白质组数据所面临的问题	第13-14页
1.3 研究现状	第14-16页
1.4 课题的主要创新点	第16页
1.5 本文组织结构及章节安排	第16-18页
第2章相关背景与关键技术介绍	第18-26页
2.1 蛋白质组数据	第18-21页
2.1.1 PRIDE	第19-20页
2.1.2 Peptide Atlas	第20页
2.1.3 Massive	第20-21页
2.2 推荐系统	第21-23页
2.2.1 电子商务	第21-23页
2.2.2 科技文献	第23页
2.3 传统TF-IDF算法概述	第23-25页
2.3.1 TF-IDF算法背景知识	第23-24页
2.3.2 传统TF-IDF算法	第24-25页
2.4 本章小结	第25-26页
第3章结合生物医学同义词和TF-IDF的文本相似度计算方法	第26-40页
3.1 蛋白质组学元数据	第26-28页
3.1.1 元数据简介	第26-27页
3.1.2 蛋白质组元数据	第27-28页
3.2 文本的相似度计算方法的概要	第28-30页
3.3 向量空间模型(VSM)	第30页
3.4 TF-IDF算法的改进	第30-33页
3.5 数据的采集及处理	第33-36页
3.5.1 文本集的获取与预处理	第33-34页
3.5.2 生物医学领域同义词库的构建	第34-36页
3.6 算法的实现	第36-37页
3.7 生物医学文本相似度计算实验及结果分析	第37-39页
3.7.1 实验设计	第37-38页
3.7.2 结果分析	第38-39页
3.8 本章小结	第39-40页
第4章基于分子证据的蛋白质组学数据相似性算法	第40-58页
4.1 蛋白质组学的分子证据	第40-41页
4.2 蛋白质组学数据	第41-42页
4.3 基于分子证据的蛋白质组学相似性算法	第42-46页
4.4 基于分子证据的蛋白质组学相似性算法实验及结果分析	第46-56页
4.4.1 数据的预处理	第46-48页
4.4.2 算法的实现	第48-49页
4.4.3 实验设计及结果分析	第49-56页
4.5 本章小结	第56-58页
第5章总结及未来工作	第58-60页
5.1 本文总结	第58-59页
5.2 后续工作与未来的研究展望	第59-60页
参考文献	第60-65页
致谢	第65-66页
攻读硕士学位期间从事的科研工作及取得的成果	第66页