首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

多数据源自动获取汉越双语平行句对方法的研究与实现

摘要第5-6页
Abstract第6页
目录第7-10页
第一章 引言第10-16页
    1.1 研究背景和意义第10-11页
    1.2 汉-越句子对齐研究现状第11-12页
    1.3 汉语-越语的特点和比较第12-13页
    1.4 论文的主要工作及结构第13-16页
        1.4.1 论文的主要工作第13-14页
        1.4.2 论文总体结构第14-16页
第二章 相关理论与技术第16-24页
    2.1 句子对齐相关概念第16-17页
    2.2 句子对齐的概率模型第17页
    2.3 句子对齐方法第17-20页
        2.3.1 基于长度的句子对齐方法第18-19页
        2.3.2 基于词汇的句子对齐方法第19-20页
        2.3.3 长度和词汇信息相结合的方法第20页
    2.4 相似度计算第20-22页
        2.4.1 长度相似度第20-21页
        2.4.2 位置相似度第21-22页
    2.5 本章小结第22-24页
第三章 汉越双语句子对齐方法研究第24-32页
    3.1 问题概述第24页
    3.2 越南语介绍第24-25页
    3.3 句子对齐中存在的问题第25-26页
    3.4 汉-越句子对齐方法的设计原则第26-27页
    3.5 主要算法第27-29页
        3.5.1 算法简单介绍第27-28页
        3.5.2 评分函数第28页
        3.5.3 动态规划递归式第28-29页
    3.6 汉-越语料的预处理第29页
    3.7 汉-越句子对齐方法策略第29-30页
    3.8 系统总体结构图第30-31页
    3.9 小结第31-32页
第四章 汉越双语句子自动对齐原型系统的设计与实现第32-46页
    4.1 自动对齐系统流程第32页
    4.2 汉-越双语语料库构建第32-36页
        4.2.1 汉-越双语语料库的构建标准第32-33页
        4.2.2 汉-越双语原始语料的收集第33-36页
        4.2.3 汉-越双语语料库语料格式转换第36页
        4.2.4 规范的训练语料库第36页
    4.3 汉-越双语语料预处理第36-42页
        4.3.1 语料输入文件第36-38页
        4.3.2 汉语和越南南语分词第38-40页
        4.3.3 汉语和越南语分句第40-42页
    4.4 汉-越南语对齐的实现第42-44页
    4.5 小结第44-46页
第五章 句子对齐实验结果分析第46-50页
    5.1 汉-越语句子对齐评价的方法第46页
    5.2 网络新闻实验结果第46-47页
    5.3 鲁迅作品实验结果第47页
    5.4 西游记小说实验结果第47页
    5.5 日常生活实验结果第47-48页
    5.6 多数据源实验结果比较及分析第48-49页
    5.7 小结第49-50页
第六章 总结与展望第50-52页
    6.1 总结第50页
    6.2 进一步的工作第50-52页
致谢第52-54页
参考文献第54-57页

论文共57页,点击 下载论文
上一篇:基于树到树的汉语—纳西语句法统计机器翻译研究
下一篇:基于脑电的自然场景下目标的快速识别研究