首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于WEB的双语句对齐语料的获取和过滤

摘要第1-5页
Abstract第5-10页
第1章 绪论第10-20页
   ·课题背景与意义第10-11页
     ·课题背景第10-11页
     ·课题意义第11页
   ·研究现状第11-16页
     ·基于WEB的双语篇章级对齐语料获取的研究第11-13页
     ·WEB文本双语句对齐的研究第13-14页
     ·双语句对齐语料过滤的研究第14-16页
   ·基于WEB的双语句对齐语料自动获取和过滤的主要问题第16-18页
     ·互联网上双语句对齐资源的复杂性第16-17页
     ·基于WEB的双语篇章级对齐资源获取存在的问题第17页
     ·WEB文本的双语句对齐存在的问题第17-18页
     ·双语句对齐语料过滤存在的问题第18页
   ·本文的主要研究内容和创新点第18-20页
第2章 互联网平行双语资源分析第20-25页
   ·互联网平行双语资源概述第20-22页
     ·互联网平行双语资源的主要种类第20-21页
     ·互联网平行双语资源的分析第21-22页
   ·互联网平行双语资源的获取策略第22-24页
   ·基于WEB的双语句对齐语料自动获取和过滤的流程图第24页
   ·本章小结第24-25页
第3章 基于WEB的双语篇章级对齐语料的获取第25-37页
   ·问题及现有方法分析第25页
   ·基于WEB的双语篇章级对齐语料的获取方法第25-33页
     ·基于双语网页指纹匹配度获取候选网页集合第25-29页
     ·双语篇章网页特征的提取第29-32页
     ·利用SVM分类器构建双语篇章对齐模型第32-33页
   ·实验结果及讨论第33-36页
     ·数据和评价方法第33-34页
     ·试验结果第34-35页
     ·试验结果的讨论第35-36页
     ·下一步的工作第36页
   ·本章小结第36-37页
第4章 WEB文本的双语句对齐第37-48页
   ·问题及现有方法分析第37页
   ·基于长度和位置信息的双语句对齐方法第37-44页
     ·基本概念第37-38页
     ·分句问题第38页
     ·句对齐模型的形式化描述第38-40页
     ·句对齐过程中锚点的选择第40-42页
     ·提高句对齐方法健壮性的措施第42-43页
     ·句对齐算法描述第43-44页
   ·试验结果及分析第44-47页
     ·数据和评价方法第44-45页
     ·试验结果及分析第45-46页
     ·下一步工作第46-47页
   ·本章小结第47-48页
第5章 双语句对齐语料的过滤第48-60页
   ·问题及现有方法分析第48-49页
   ·基于SVM分类器的双语句对分类模型第49-54页
     ·高质量双语句对的定义第49-50页
     ·双语句对齐语料的预处理第50-51页
     ·双语句对齐特征第51-53页
     ·构建基于SVM分类器的双语句对分类模型第53-54页
   ·试验结果及分析第54-59页
     ·数据和评价方法第54-56页
     ·试验结果及分析第56-58页
     ·下一步工作第58-59页
   ·本章小结第59-60页
结论第60-62页
参考文献第62-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:基于PSM模型业务构件的配置逻辑研究及工具实现
下一篇:可信性相关属性评测方法的设计与实现