首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--翻译机论文

基于Spark的大规模机器翻译模型训练方法与系统研究

摘要第6-8页
Abstract第8-9页
第一章 绪论第13-19页
    1.1 研究背景和意义第13-15页
    1.2 国内外研究现状第15-16页
    1.3 本文主要工作第16-17页
    1.4 本文结构第17-19页
第二章 背景知识第19-31页
    2.1 机器翻译第19-24页
        2.1.1 机器翻译的发展第19-21页
        2.1.2 统计机器翻译处理过程与系统组成第21-22页
        2.1.3 翻译模型的分类第22-24页
    2.2 大数据并行处理系统平台第24-30页
        2.2.1 大数据并行处理系统概述第24-25页
        2.2.2 HDFS分布式文件系统第25-26页
        2.2.3 Spark计算框架介绍第26-30页
    2.3 本章小结第30-31页
第三章 翻译模型训练过程与基础支撑算法研究第31-44页
    3.1 翻译模型的基本训练过程第31-34页
    3.2 并行化训练方法与系统框架第34-35页
    3.3 最大似然估计及其并行化算法第35-40页
        3.3.1 最大似然估计方法概述第35-37页
        3.3.2 基于join操作的最大似然估计并行算法第37-40页
    3.4 分布式参数管理机制与方法设计第40-43页
        3.4.1 分布式参数管理方法概述第40页
        3.4.2 基于Broadcast的参数管理策略第40-42页
        3.4.3 基于HDFS的参数管理策略第42-43页
    3.5 本章小结第43-44页
第四章 大规模词对齐训练方法研究第44-59页
    4.1 概述第44-45页
    4.2 EM算法概述第45-46页
    4.3 分布式EM训练方法与框架第46-49页
        4.3.1 数据预处理第46-47页
        4.3.2 数据存储与分片优化第47-48页
        4.3.3 训练流程第48-49页
    4.4 “IBM模型一”训练算法并行化第49-52页
    4.5 “HMM词对齐模型”训练算法并行化第52-54页
    4.6 基于MGIZA++的分布式词对齐训练第54-58页
    4.7 本章小结第58-59页
第五章 大规模翻译模型训练方法研究第59-67页
    5.1 分布式翻译模型训练方法与框架第59-62页
    5.2 大规模短语翻译模型训练第62-65页
        5.2.1 词翻译概率计算第62-63页
        5.2.2 短语抽取与聚合第63-64页
        5.2.3 参数估计第64-65页
    5.3 大规模层次短语翻译模型训练第65-66页
        5.3.1 规则抽取第65页
        5.3.2 参数估计第65-66页
    5.4 本章小结第66-67页
第六章 大规模翻译模型训练系统设计与实现第67-76页
    6.1 Seal系统的总体框架与组成第67-68页
    6.2 Seal系统的数据存储与组织第68-69页
    6.3 Seal系统功能设计第69页
    6.4 主要模块设计第69-73页
        6.4.1 基础模块设计第70-71页
        6.4.2 词对齐模块设计第71-73页
        6.4.3 翻译模型模块设计第73页
    6.5 系统使用说明第73-75页
        6.5.1 环境部署第73-74页
        6.5.2 执行命令和参数配置第74-75页
    6.6 本章小结第75-76页
第七章 实验设计与结果分析第76-85页
    7.1 实验设置第76-77页
    7.2 词对齐模型的并行化训练性能第77-80页
        7.2.1 单个词对齐模型训练的性能测试第77-79页
        7.2.2 Align_on_MGIZA的性能测试第79-80页
    7.3 短语翻译模型的并行化训练性能第80-82页
        7.3.1 数据扩展性实验第80-81页
        7.3.2 节点扩展性实验第81-82页
    7.4 层次化短语翻译模型的并行化训练性能第82-84页
        7.4.1 数据扩展性实验第82-83页
        7.4.2 节点扩展性实验第83-84页
    7.5 本章小结第84-85页
第八章 总结和展望第85-88页
    8.1 本文工作总结第85-86页
    8.2 进一步工作第86-88页
致谢第88-89页
参考文献第89-93页
附录第93-94页

论文共94页,点击 下载论文
上一篇:高校图书馆电子书管理服务平台构建研究
下一篇:增强型地热系统复合发电方式优化及适用性研究