对偶学习的理论和实验研究
摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
第1章 绪论 | 第13-25页 |
1.1 选题的背景和意义 | 第13-15页 |
1.2 国内外研究现状 | 第15-20页 |
1.2.1 深度学习 | 第15-18页 |
1.2.2 无标数据的使用 | 第18-19页 |
1.2.3 多任务学习 | 第19页 |
1.2.4 迁移学习 | 第19-20页 |
1.3 研究内容和主要贡献 | 第20-22页 |
1.4 本文的组织结构 | 第22-25页 |
第2章 对偶学习相关的深度学习背景介绍 | 第25-49页 |
2.1 深度神经网络简介 | 第25-34页 |
2.1.1 全连接网络 | 第25-29页 |
2.1.2 卷积神经网络 | 第29-31页 |
2.1.3 递归神经网络 | 第31-34页 |
2.2 神经机器翻译 | 第34-41页 |
2.2.1 神经机器翻译基本结构 | 第34-39页 |
2.2.2 Transformer网络结构 | 第39-40页 |
2.2.3 语言模型 | 第40-41页 |
2.3 图像处理 | 第41-46页 |
2.3.1 图像分类任务 | 第41-44页 |
2.3.2 图像生成任务 | 第44-46页 |
2.4 情感分析 | 第46-49页 |
2.4.1 情感分类 | 第46-47页 |
2.4.2 带有情感色彩的句子生成 | 第47-49页 |
第3章 对偶无监督学习 | 第49-61页 |
3.1 引言 | 第49-50页 |
3.2 模型 | 第50-52页 |
3.3 实验 | 第52-55页 |
3.3.1 实验设置 | 第53-54页 |
3.3.2 实验结果 | 第54-55页 |
3.4 讨论和拓展 | 第55-57页 |
3.5 对偶无监督学习在图像生成中的应用 | 第57-60页 |
3.5.1 问题定义 | 第58页 |
3.5.2 模型和算法 | 第58-60页 |
3.6 本章小结 | 第60-61页 |
第4章 对偶有监督学习 | 第61-81页 |
4.1 引言 | 第61-62页 |
4.2 算法 | 第62-67页 |
4.2.1 问题定义 | 第63页 |
4.2.2 理论分析 | 第63-65页 |
4.2.3 算法描述 | 第65-66页 |
4.2.4 讨论 | 第66-67页 |
4.3 对偶有监督学习在神经机器翻译中的应用 | 第67-71页 |
4.3.1 实验设置 | 第67-68页 |
4.3.2 实验结果 | 第68-71页 |
4.4 对偶有监督学习在图像处理中的应用 | 第71-74页 |
4.4.1 实验设置 | 第71-72页 |
4.4.2 图像分类结果 | 第72-73页 |
4.4.3 图像生成结果 | 第73-74页 |
4.5 对偶有监督学习在情感分析中的应用 | 第74-77页 |
4.5.1 实验设置 | 第74-75页 |
4.5.2 实验结果 | 第75-76页 |
4.5.3 讨论 | 第76-77页 |
4.6 退化的对偶学习 | 第77-79页 |
4.6.1 基于联合分布的退化的对偶学习 | 第77-78页 |
4.6.2 基于边缘分布的退化的对偶学习 | 第78-79页 |
4.7 本章小结 | 第79-81页 |
第5章 对偶推断 | 第81-95页 |
5.1 引言 | 第81页 |
5.2 对偶推断的框架 | 第81-84页 |
5.2.1 算法 | 第81-82页 |
5.2.2 理论分析 | 第82-84页 |
5.3 对偶推断在神经机器翻译中的应用 | 第84-87页 |
5.3.1 算法 | 第84页 |
5.3.2 实验设置 | 第84-85页 |
5.3.3 实验结果 | 第85-87页 |
5.4 对偶推断在情感分析中的应用 | 第87-90页 |
5.4.1 实验设置 | 第87-88页 |
5.4.2 情感分类问题的结果 | 第88页 |
5.4.3 句子生成的结果 | 第88-90页 |
5.5 对偶推断在图像处理中的应用 | 第90-92页 |
5.5.1 实验设置 | 第90页 |
5.5.2 图像分类的结果 | 第90页 |
5.5.3 图像生成的结果 | 第90-92页 |
5.6 讨论 | 第92-93页 |
5.7 本章小结 | 第93-95页 |
第6章 模型层面的对偶学习 | 第95-109页 |
6.1 引言 | 第95-97页 |
6.2 模型框架 | 第97-101页 |
6.2.1 对称的模型层面的对偶学习 | 第97-99页 |
6.2.2 非对称的模型层面的对偶学习 | 第99-100页 |
6.2.3 讨论 | 第100页 |
6.2.4 理论分析 | 第100-101页 |
6.3 模型层面的对偶学习在神经机器翻译中的应用 | 第101-106页 |
6.3.1 模型适配 | 第102-103页 |
6.3.2 模型设置 | 第103-104页 |
6.3.3 实验结果 | 第104-106页 |
6.4 模型层面的对偶学习在情感分析中的应用 | 第106-107页 |
6.4.1 实验设置 | 第106-107页 |
6.4.2 实验结果 | 第107页 |
6.5 与对偶推断的结合 | 第107-108页 |
6.6 本章小结 | 第108-109页 |
第7章 推敲网络 | 第109-123页 |
7.1 引言 | 第109-111页 |
7.2 模型框架 | 第111-114页 |
7.2.1 推敲网络的结构 | 第111页 |
7.2.2 编码器和第一阶段解码器 | 第111-112页 |
7.2.3 第二阶段解码器 | 第112-113页 |
7.2.4 算法 | 第113-114页 |
7.3 推敲网络在神经机器翻译中的应用 | 第114-121页 |
7.3.1 推敲网络和浅层模型的结合 | 第114-118页 |
7.3.2 推敲网络与对偶学习结合 | 第118-121页 |
7.4 推敲网络在摘要生成中的应用 | 第121-122页 |
7.4.1 实验设置 | 第121-122页 |
7.4.2 实验结果 | 第122页 |
7.5 本章小结 | 第122-123页 |
第8章 总结与展望 | 第123-125页 |
参考文献 | 第125-141页 |
附录A 博士期间其他工作:带预算约束的多臂赌博机 | 第141-151页 |
A.1 问题描述 | 第141-142页 |
A.2 算法 | 第142-147页 |
A.2.1 基于置信上界的算法 | 第142-145页 |
A.2.2 基于贪心算法 | 第145页 |
A.2.3 基于贝叶斯的办法 | 第145-147页 |
A.3 问题的拓展 | 第147-151页 |
致谢 | 第151-153页 |
在读期间发表的学术论文与取得的研究成果 | 第153-155页 |