对偶学习的理论和实验研究
| 摘要 | 第5-7页 |
| ABSTRACT | 第7-8页 |
| 第1章 绪论 | 第13-25页 |
| 1.1 选题的背景和意义 | 第13-15页 |
| 1.2 国内外研究现状 | 第15-20页 |
| 1.2.1 深度学习 | 第15-18页 |
| 1.2.2 无标数据的使用 | 第18-19页 |
| 1.2.3 多任务学习 | 第19页 |
| 1.2.4 迁移学习 | 第19-20页 |
| 1.3 研究内容和主要贡献 | 第20-22页 |
| 1.4 本文的组织结构 | 第22-25页 |
| 第2章 对偶学习相关的深度学习背景介绍 | 第25-49页 |
| 2.1 深度神经网络简介 | 第25-34页 |
| 2.1.1 全连接网络 | 第25-29页 |
| 2.1.2 卷积神经网络 | 第29-31页 |
| 2.1.3 递归神经网络 | 第31-34页 |
| 2.2 神经机器翻译 | 第34-41页 |
| 2.2.1 神经机器翻译基本结构 | 第34-39页 |
| 2.2.2 Transformer网络结构 | 第39-40页 |
| 2.2.3 语言模型 | 第40-41页 |
| 2.3 图像处理 | 第41-46页 |
| 2.3.1 图像分类任务 | 第41-44页 |
| 2.3.2 图像生成任务 | 第44-46页 |
| 2.4 情感分析 | 第46-49页 |
| 2.4.1 情感分类 | 第46-47页 |
| 2.4.2 带有情感色彩的句子生成 | 第47-49页 |
| 第3章 对偶无监督学习 | 第49-61页 |
| 3.1 引言 | 第49-50页 |
| 3.2 模型 | 第50-52页 |
| 3.3 实验 | 第52-55页 |
| 3.3.1 实验设置 | 第53-54页 |
| 3.3.2 实验结果 | 第54-55页 |
| 3.4 讨论和拓展 | 第55-57页 |
| 3.5 对偶无监督学习在图像生成中的应用 | 第57-60页 |
| 3.5.1 问题定义 | 第58页 |
| 3.5.2 模型和算法 | 第58-60页 |
| 3.6 本章小结 | 第60-61页 |
| 第4章 对偶有监督学习 | 第61-81页 |
| 4.1 引言 | 第61-62页 |
| 4.2 算法 | 第62-67页 |
| 4.2.1 问题定义 | 第63页 |
| 4.2.2 理论分析 | 第63-65页 |
| 4.2.3 算法描述 | 第65-66页 |
| 4.2.4 讨论 | 第66-67页 |
| 4.3 对偶有监督学习在神经机器翻译中的应用 | 第67-71页 |
| 4.3.1 实验设置 | 第67-68页 |
| 4.3.2 实验结果 | 第68-71页 |
| 4.4 对偶有监督学习在图像处理中的应用 | 第71-74页 |
| 4.4.1 实验设置 | 第71-72页 |
| 4.4.2 图像分类结果 | 第72-73页 |
| 4.4.3 图像生成结果 | 第73-74页 |
| 4.5 对偶有监督学习在情感分析中的应用 | 第74-77页 |
| 4.5.1 实验设置 | 第74-75页 |
| 4.5.2 实验结果 | 第75-76页 |
| 4.5.3 讨论 | 第76-77页 |
| 4.6 退化的对偶学习 | 第77-79页 |
| 4.6.1 基于联合分布的退化的对偶学习 | 第77-78页 |
| 4.6.2 基于边缘分布的退化的对偶学习 | 第78-79页 |
| 4.7 本章小结 | 第79-81页 |
| 第5章 对偶推断 | 第81-95页 |
| 5.1 引言 | 第81页 |
| 5.2 对偶推断的框架 | 第81-84页 |
| 5.2.1 算法 | 第81-82页 |
| 5.2.2 理论分析 | 第82-84页 |
| 5.3 对偶推断在神经机器翻译中的应用 | 第84-87页 |
| 5.3.1 算法 | 第84页 |
| 5.3.2 实验设置 | 第84-85页 |
| 5.3.3 实验结果 | 第85-87页 |
| 5.4 对偶推断在情感分析中的应用 | 第87-90页 |
| 5.4.1 实验设置 | 第87-88页 |
| 5.4.2 情感分类问题的结果 | 第88页 |
| 5.4.3 句子生成的结果 | 第88-90页 |
| 5.5 对偶推断在图像处理中的应用 | 第90-92页 |
| 5.5.1 实验设置 | 第90页 |
| 5.5.2 图像分类的结果 | 第90页 |
| 5.5.3 图像生成的结果 | 第90-92页 |
| 5.6 讨论 | 第92-93页 |
| 5.7 本章小结 | 第93-95页 |
| 第6章 模型层面的对偶学习 | 第95-109页 |
| 6.1 引言 | 第95-97页 |
| 6.2 模型框架 | 第97-101页 |
| 6.2.1 对称的模型层面的对偶学习 | 第97-99页 |
| 6.2.2 非对称的模型层面的对偶学习 | 第99-100页 |
| 6.2.3 讨论 | 第100页 |
| 6.2.4 理论分析 | 第100-101页 |
| 6.3 模型层面的对偶学习在神经机器翻译中的应用 | 第101-106页 |
| 6.3.1 模型适配 | 第102-103页 |
| 6.3.2 模型设置 | 第103-104页 |
| 6.3.3 实验结果 | 第104-106页 |
| 6.4 模型层面的对偶学习在情感分析中的应用 | 第106-107页 |
| 6.4.1 实验设置 | 第106-107页 |
| 6.4.2 实验结果 | 第107页 |
| 6.5 与对偶推断的结合 | 第107-108页 |
| 6.6 本章小结 | 第108-109页 |
| 第7章 推敲网络 | 第109-123页 |
| 7.1 引言 | 第109-111页 |
| 7.2 模型框架 | 第111-114页 |
| 7.2.1 推敲网络的结构 | 第111页 |
| 7.2.2 编码器和第一阶段解码器 | 第111-112页 |
| 7.2.3 第二阶段解码器 | 第112-113页 |
| 7.2.4 算法 | 第113-114页 |
| 7.3 推敲网络在神经机器翻译中的应用 | 第114-121页 |
| 7.3.1 推敲网络和浅层模型的结合 | 第114-118页 |
| 7.3.2 推敲网络与对偶学习结合 | 第118-121页 |
| 7.4 推敲网络在摘要生成中的应用 | 第121-122页 |
| 7.4.1 实验设置 | 第121-122页 |
| 7.4.2 实验结果 | 第122页 |
| 7.5 本章小结 | 第122-123页 |
| 第8章 总结与展望 | 第123-125页 |
| 参考文献 | 第125-141页 |
| 附录A 博士期间其他工作:带预算约束的多臂赌博机 | 第141-151页 |
| A.1 问题描述 | 第141-142页 |
| A.2 算法 | 第142-147页 |
| A.2.1 基于置信上界的算法 | 第142-145页 |
| A.2.2 基于贪心算法 | 第145页 |
| A.2.3 基于贝叶斯的办法 | 第145-147页 |
| A.3 问题的拓展 | 第147-151页 |
| 致谢 | 第151-153页 |
| 在读期间发表的学术论文与取得的研究成果 | 第153-155页 |