摘要 | 第3-5页 |
ABSTRACT | 第5-7页 |
第一章 绪论 | 第15-37页 |
1.1 引言 | 第15-16页 |
1.2 蛋白质功能预测概述 | 第16-21页 |
1.2.1 蛋白质及其功能注释简介 | 第16-19页 |
1.2.2 蛋白质功能预测方法研究现状 | 第19-21页 |
1.3 基于多标签分类的蛋白质功能预测方法 | 第21-24页 |
1.3.1 形式化描述 | 第21-22页 |
1.3.2 现有研究存在的问题 | 第22-24页 |
1.4 面向蛋白质功能预测的主题模型研究 | 第24-31页 |
1.4.1 主题模型简介 | 第25-26页 |
1.4.2 主题模型在生物信息中的研究现状 | 第26-28页 |
1.4.3 多标签监督主题模型的优势 | 第28-29页 |
1.4.4 面临的挑战 | 第29-31页 |
1.5 论文研究内容 | 第31-33页 |
1.6 论文组织结构 | 第33-37页 |
第二章 相关基础 | 第37-57页 |
2.1 主题模型建模方法及其发展 | 第37-51页 |
2.1.1 词包构造 | 第37-38页 |
2.1.2 LDA模型描述 | 第38-40页 |
2.1.3 LDA模型的生成过程 | 第40-42页 |
2.1.4 LDA模型的学习 | 第42-48页 |
2.1.5 主题模型的发展 | 第48-51页 |
2.2 基于多标签分类的蛋白质功能预测基础 | 第51-55页 |
2.2.1 数据集及预处理 | 第51-52页 |
2.2.2 评价指标 | 第52-55页 |
2.3 本章小结 | 第55-57页 |
第三章 基于布尔矩阵分解的蛋白质功能预测框架 | 第57-75页 |
3.1 针对大规模标签的多标签分类问题分析 | 第57-58页 |
3.2 基于BMD的蛋白质功能预测框架 | 第58-60页 |
3.3 基于标签簇的布尔矩阵分解 | 第60-67页 |
3.3.1 布尔矩阵分解问题分析 | 第60-61页 |
3.3.2 符号定义 | 第61页 |
3.3.3 精确BMD算法 | 第61-62页 |
3.3.4 功能标签关联矩阵 | 第62-63页 |
3.3.5 基于标签簇的精确BMD算法 | 第63-67页 |
3.3.6 算法时间复杂度分析 | 第67页 |
3.4 实验 | 第67-73页 |
3.4.1 数据集 | 第68页 |
3.4.2 基于标签簇的精确BMD算法实验 | 第68-70页 |
3.4.3 基于BMD的蛋白质功能预测框架实验 | 第70-73页 |
3.5 本章小结 | 第73-75页 |
第四章 多标签监督主题模型 | 第75-113页 |
4.1 问题分析 | 第75-76页 |
4.2 蛋白质功能预测的主题建模 | 第76-79页 |
4.3 符号定义 | 第79-80页 |
4.4 标签分布LDA模型 | 第80-101页 |
4.4.1 LD-LDA模型描述 | 第80-81页 |
4.4.2 LD-LDA模型生成过程 | 第81-83页 |
4.4.3 LD-LDA与LLDA和PLDA对比 | 第83-84页 |
4.4.4 LD-LDA模型的学习算法 | 第84-101页 |
4.5 实验 | 第101-111页 |
4.5.1 数据集 | 第101-102页 |
4.5.2 参数对模型实验效果的影响 | 第102-105页 |
4.5.3 多标签监督主题模型与传统多标签分类器的实验对比 | 第105-107页 |
4.5.4 蛋白质功能预测中的主题发现 | 第107-109页 |
4.5.5 LD-LDA模型的推理算法实验对比 | 第109-111页 |
4.6 本章小结 | 第111-113页 |
第五章 引入特征的多标签监督主题模型 | 第113-165页 |
5.1 问题分析 | 第113-115页 |
5.2 DMR-LDA模型介绍 | 第115-118页 |
5.2.1 DMR模型 | 第115-116页 |
5.2.2 DMR-LDA 模型 | 第116-118页 |
5.3 DMR-LLDA 模型 | 第118-132页 |
5.3.1 DMR-LLDA 模型描述 | 第118-120页 |
5.3.2 DMR-LLDA 模型生成过程 | 第120-122页 |
5.3.3 DMR-LLDA 学习算法 | 第122-132页 |
5.4 DMR-PLDA 模型 | 第132-144页 |
5.4.1 DMR-PLDA 模型描述 | 第132-136页 |
5.4.2 DMR-PLDA 模型生成过程 | 第136-138页 |
5.4.3 DMR-PLDA 学习算法 | 第138-144页 |
5.5 DMR-LDLDA 模型 | 第144-153页 |
5.5.1 DMR-LDLDA 模型描述 | 第144-146页 |
5.5.2 DMR-LDLDA 模型生成过程 | 第146-148页 |
5.5.3 DMR-LDLDA 推理学习算法 | 第148-153页 |
5.6 实验 | 第153-162页 |
5.6.1 数据集及实验设置 | 第153-154页 |
5.6.2 蛋白质特征对模型超参的影响 | 第154-155页 |
5.6.3 DMR-LLDA 模型实验分析 | 第155-157页 |
5.6.4 DMR-PLDA 模型实验分析 | 第157-160页 |
5.6.5 DMR-LDLDA 模型实验分析 | 第160-162页 |
5.7 本章小结 | 第162-165页 |
第六章 关联标签监督主题模型 | 第165-201页 |
6.1 问题分析 | 第165-168页 |
6.2 CLLDA 模型 | 第168-180页 |
6.2.1 CLLDA 模型描述 | 第168-171页 |
6.2.2 CLLDA 模型的生成过程 | 第171-172页 |
6.2.3 CLLDA 学习算法 | 第172-180页 |
6.3 CLDLDA 模型 | 第180-193页 |
6.3.1 CLDLDA 模型描述 | 第180-182页 |
6.3.2 CLDLDA 模型的生成过程 | 第182-185页 |
6.3.3 CLDLDA 学习算法 | 第185-193页 |
6.4 实验 | 第193-199页 |
6.4.1 数据集及实验设置 | 第193页 |
6.4.2 标签关联对模型超参的影响 | 第193-194页 |
6.4.3 CLLDA 模型实验分析 | 第194-197页 |
6.4.4 CLDLDA 模型实验分析 | 第197-199页 |
6.5 本章小结 | 第199-201页 |
第七章 总结和展望 | 第201-205页 |
7.1 论文工作总结 | 第201-203页 |
7.2 课题研究展望 | 第203-205页 |
参考文献 | 第205-215页 |
攻读博士学位期间完成的科研成果 | 第215-217页 |
致谢 | 第217页 |