首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

汉老双语句子对齐方法研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-18页
    1.1 课题研究背景及意义第10页
    1.2 研究现状第10-14页
        1.2.1 双语语料库建设研究现状第11-13页
        1.2.2 双语句子对齐技术研究现状第13-14页
    1.3 研究内容第14-15页
    1.4 论文的组织第15-16页
    1.5 本文的创新点第16-18页
第二章 基于维基百科的汉老双语平行语料库构建第18-24页
    2.1 引言第18页
    2.2 基于维基百科的汉老双语平行语料爬取分析第18-21页
        2.2.1 相关概述第18-19页
        2.2.2 平行语料种类第19-20页
        2.2.3 平行语料爬取分析第20-21页
        2.2.4 平行语料获取策略第21页
    2.3 基于维基百科的汉老双语平行句对获取方法第21-23页
    2.4 汉老双语词典的构建第23页
    2.5 本章小结第23-24页
第三章 老挝语句法特点分析及汉老双语文本特征选取第24-32页
    3.1 引言第24页
    3.2 老挝语语言特点及汉老句法特征分析第24-26页
        3.2.1 老挝语语言特点第24-25页
        3.2.2 汉语与老挝语的句法结构特点第25-26页
    3.3 汉老双语文本特征选取第26-30页
        3.3.1 句子长度比例特征第26-27页
        3.3.2 词典匹配特征第27-28页
        3.3.3 词共现率特征第28-29页
        3.3.4 数字特征第29-30页
    3.4 本章小结第30-32页
第四章 融入多特征的汉老双语平行句对抽取方法研究第32-48页
    4.1 引言第32页
    4.2 分类算法概述第32-34页
        4.2.1 支持向量机模型第33页
        4.2.2 最大熵模型第33-34页
    4.3 融入多特征的汉老双语平行句对抽取方法第34-42页
        4.3.1 融入多特征的特征权重计算第36页
        4.3.2 融入多特征的SVM模型第36-40页
        4.3.3 融入多特征的最大熵模型第40-42页
    4.4 实验及分析第42-46页
        4.4.1 实验设计及数据第42页
        4.4.2 实验结果的评估指标第42-43页
        4.4.3 融入多特征的SVM模型与最大熵模型的比较第43-44页
        4.4.4 融入不同特征的SVM模型的比较第44-46页
    4.5 本章小结第46-48页
第五章 总结与展望第48-50页
    5.1 总结第48页
    5.2 展望第48-50页
致谢第50-52页
参考文献第52-56页
附录A 攻读硕士学位期间发表论文第56-58页
附录B 攻读硕士学位期间发表软件著作权第58-60页
附录C 攻读硕士期间参与科研项目第60页

论文共60页,点击 下载论文
上一篇:紫藤叶斑病的病原鉴定及生物学特性研究
下一篇:基于动词—论元结构的新闻篇章事件链构建技术研究