首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--翻译机论文

双语平行句对的获取与语料库的建立

摘要第4-5页
Abstract第5页
第1章 绪论第11-20页
    1.1 课题背景及研究的目的和意义第11-14页
    1.2 国内外相关研究第14-17页
    1.3 本文的研究内容第17-20页
        1.3.1 平行语料的获取第17-18页
        1.3.2 语料库的建立第18-20页
第2章 基于多特征融合的双语对齐第20-36页
    2.1 引言第20-21页
    2.2 互联网双语对齐的问题描述第21-25页
    2.3 基于锚点的段落对齐方法第25-29页
        2.3.1 锚点的评价函数第25-27页
        2.3.2 段落对齐的计算方法第27-29页
    2.4 基于多特征融合的句子对齐方法第29-33页
        2.4.1 相似度的评价函数第29-32页
        2.4.2 句子对齐的计算方法第32-33页
    2.5 实验与结果分析第33-35页
        2.5.1 评价方法第33-34页
        2.5.2 Baseline 模型第34页
        2.5.3 性能指标分析第34-35页
    2.6 本章小结第35-36页
第3章 基于在线 BLEU 的语料质量评估方法第36-48页
    3.1 引言第36-37页
    3.2 参考翻译的获取第37页
    3.3 BLEU 评测方法第37-39页
    3.4 在线 BLEU 计算方法第39-40页
    3.5 人工评价结果获取第40-42页
        3.5.1 志愿者手工打分第40-41页
        3.5.2 翻译众包平台第41-42页
    3.6 实验及结果分析第42-47页
        3.6.1 实验结果评价第42-43页
        3.6.2 相关性分析第43-44页
        3.6.3 语料库来源网站质量分析第44-47页
    3.7 本章小结第47-48页
第4章 基于文本分类的语料领域划分第48-60页
    4.1 引言第48-49页
    4.2 文本表示第49-51页
        4.2.1 预处理和消歧第49页
        4.2.2 向量空间模型(VSM)第49-50页
        4.2.3 TFIDF 方法第50-51页
    4.3 特征抽取方法第51-53页
        4.3.1 文档频率第51页
        4.3.2 信息增益第51-52页
        4.3.3 CHI 统计方法第52-53页
        4.3.4 互信息第53页
    4.4 分类器第53-55页
        4.4.1 KNN第53-54页
        4.4.2 SVM第54-55页
    4.5 实验及结果分析第55-59页
        4.5.1 实验语料第55页
        4.5.2 评估方法第55-56页
        4.5.3 领域分类结果第56-58页
        4.5.4 子领域分类结果第58-59页
    4.6 本章小结第59-60页
结论第60-62页
参考文献第62-68页
致谢第68-69页

论文共69页,点击 下载论文
上一篇:HEVC中CU分割及帧内预测模式快速算法的研究与应用
下一篇:基于多分类支持向量机和视觉词典的图像分类系统研究与实现