神经机器翻译模型的实现验证及其剪枝压缩

摘要	第4-6页
Abstract	第6-7页
第一章绪论	第14-19页
1.1 研究背景及意义	第14-15页
1.2 国内外发展现状	第15-17页
1.3 主要研究内容	第17-18页
1.4 本文组织结构	第18-19页
第二章基于LSTM的神经机器翻译模型	第19-34页
2.1 循环神经网络	第19-21页
2.2 长短时记忆网络	第21-24页
2.3 Seq2Seq模型	第24-25页
2.4 注意力机制	第25-29页
2.5 模型压缩方法	第29-32页
2.5.1 剪枝	第29-30页
2.5.2 量化	第30-31页
2.5.3 知识蒸馏	第31-32页
2.6 本章小结	第32-34页
第三章神经机器翻译模型及其剪枝优化	第34-57页
3.1　深度学习框架PyTorch	第34-36页
3.1.1 张量	第34-35页
3.1.2 自动求导机制与Variable	第35-36页
3.1.3 PyTorch中的长短时记忆网络API	第36页
3.2 PyTorch中的Seq2Seq模型实现	第36-41页
3.2.1 Encoder	第36-38页
3.2.2 Decoder	第38-39页
3.2.3 包含注意力机制的Decoder	第39-41页
3.3 OpenNMT语言模型	第41-50页
3.3.1 数据预处理	第41-42页
3.3.2 训练模块	第42-44页
3.3.3 翻译模块	第44-46页
3.3.4 BLEU算法	第46-49页
3.3.5　集束搜索算法	第49-50页
3.4 神经机器翻译模型的剪枝优化	第50-56页
3.4.1 Seq2Seq模型的权值类型	第50-51页
3.4.2 权值剪枝	第51-53页
3.4.3 权值剪枝的实现	第53-54页
3.4.4 剪枝模型的重新训练	第54-56页
3.5 本章小结	第56-57页
第四章实验与分析	第57-67页
4.1 硬件环境	第57页
4.2 数据集介绍	第57-58页
4.3 实验	第58-65页
4.3.1 普通Seq2Seq模型的运行结果	第58-60页
4.3.2 不同剪枝类型的效果对比	第60-61页
4.3.3 分类剪枝	第61-63页
4.3.4 剪枝模型的重新训练	第63-64页
4.3.5 剪枝-重新训练过程的迭代	第64-65页
4.4 普遍性测试	第65页
4.5 本章小结	第65-67页
第五章总结与展望	第67-70页
5.1 总结	第67-68页
5.2 展望	第68-70页
参考文献	第70-74页
攻读硕士学位期间的工作和成果	第74-75页
致谢	第75-77页