对偶学习的理论和实验研究

摘要	第5-7页
ABSTRACT	第7-8页
第1章绪论	第13-25页
1.1 选题的背景和意义	第13-15页
1.2 国内外研究现状	第15-20页
1.2.1 深度学习	第15-18页
1.2.2 无标数据的使用	第18-19页
1.2.3 多任务学习	第19页
1.2.4 迁移学习	第19-20页
1.3 研究内容和主要贡献	第20-22页
1.4 本文的组织结构	第22-25页
第2章对偶学习相关的深度学习背景介绍	第25-49页
2.1 深度神经网络简介	第25-34页
2.1.1 全连接网络	第25-29页
2.1.2 卷积神经网络	第29-31页
2.1.3 递归神经网络	第31-34页
2.2 神经机器翻译	第34-41页
2.2.1 神经机器翻译基本结构	第34-39页
2.2.2 Transformer网络结构	第39-40页
2.2.3 语言模型	第40-41页
2.3 图像处理	第41-46页
2.3.1 图像分类任务	第41-44页
2.3.2 图像生成任务	第44-46页
2.4 情感分析	第46-49页
2.4.1 情感分类	第46-47页
2.4.2 带有情感色彩的句子生成	第47-49页
第3章对偶无监督学习	第49-61页
3.1 引言	第49-50页
3.2 模型	第50-52页
3.3 实验	第52-55页
3.3.1 实验设置	第53-54页
3.3.2 实验结果	第54-55页
3.4 讨论和拓展	第55-57页
3.5 对偶无监督学习在图像生成中的应用	第57-60页
3.5.1 问题定义	第58页
3.5.2 模型和算法	第58-60页
3.6 本章小结	第60-61页
第4章对偶有监督学习	第61-81页
4.1 引言	第61-62页
4.2 算法	第62-67页
4.2.1 问题定义	第63页
4.2.2 理论分析	第63-65页
4.2.3 算法描述	第65-66页
4.2.4 讨论	第66-67页
4.3 对偶有监督学习在神经机器翻译中的应用	第67-71页
4.3.1 实验设置	第67-68页
4.3.2 实验结果	第68-71页
4.4 对偶有监督学习在图像处理中的应用	第71-74页
4.4.1 实验设置	第71-72页
4.4.2 图像分类结果	第72-73页
4.4.3 图像生成结果	第73-74页
4.5 对偶有监督学习在情感分析中的应用	第74-77页
4.5.1 实验设置	第74-75页
4.5.2 实验结果	第75-76页
4.5.3 讨论	第76-77页
4.6 退化的对偶学习	第77-79页
4.6.1 基于联合分布的退化的对偶学习	第77-78页
4.6.2 基于边缘分布的退化的对偶学习	第78-79页
4.7 本章小结	第79-81页
第5章对偶推断	第81-95页
5.1 引言	第81页
5.2 对偶推断的框架	第81-84页
5.2.1 算法	第81-82页
5.2.2 理论分析	第82-84页
5.3 对偶推断在神经机器翻译中的应用	第84-87页
5.3.1 算法	第84页
5.3.2 实验设置	第84-85页
5.3.3 实验结果	第85-87页
5.4 对偶推断在情感分析中的应用	第87-90页
5.4.1 实验设置	第87-88页
5.4.2 情感分类问题的结果	第88页
5.4.3 句子生成的结果	第88-90页
5.5 对偶推断在图像处理中的应用	第90-92页
5.5.1 实验设置	第90页
5.5.2 图像分类的结果	第90页
5.5.3 图像生成的结果	第90-92页
5.6 讨论	第92-93页
5.7 本章小结	第93-95页
第6章模型层面的对偶学习	第95-109页
6.1 引言	第95-97页
6.2 模型框架	第97-101页
6.2.1 对称的模型层面的对偶学习	第97-99页
6.2.2 非对称的模型层面的对偶学习	第99-100页
6.2.3 讨论	第100页
6.2.4 理论分析	第100-101页
6.3 模型层面的对偶学习在神经机器翻译中的应用	第101-106页
6.3.1 模型适配	第102-103页
6.3.2 模型设置	第103-104页
6.3.3 实验结果	第104-106页
6.4 模型层面的对偶学习在情感分析中的应用	第106-107页
6.4.1 实验设置	第106-107页
6.4.2 实验结果	第107页
6.5 与对偶推断的结合	第107-108页
6.6 本章小结	第108-109页
第7章推敲网络	第109-123页
7.1 引言	第109-111页
7.2 模型框架	第111-114页
7.2.1 推敲网络的结构	第111页
7.2.2 编码器和第一阶段解码器	第111-112页
7.2.3 第二阶段解码器	第112-113页
7.2.4 算法	第113-114页
7.3 推敲网络在神经机器翻译中的应用	第114-121页
7.3.1 推敲网络和浅层模型的结合	第114-118页
7.3.2 推敲网络与对偶学习结合	第118-121页
7.4 推敲网络在摘要生成中的应用	第121-122页
7.4.1 实验设置	第121-122页
7.4.2 实验结果	第122页
7.5 本章小结	第122-123页
第8章总结与展望	第123-125页
参考文献	第125-141页
附录A 博士期间其他工作:带预算约束的多臂赌博机	第141-151页
A.1 问题描述	第141-142页
A.2 算法	第142-147页
A.2.1 基于置信上界的算法	第142-145页
A.2.2 基于贪心算法	第145页
A.2.3 基于贝叶斯的办法	第145-147页
A.3 问题的拓展	第147-151页
致谢	第151-153页
在读期间发表的学术论文与取得的研究成果	第153-155页