首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

从互联网上挖掘双语语料的研究与实现

论文摘要第1-7页
ABSTRACT第7-12页
第一章 绪论第12-16页
   ·背景概述第12-14页
   ·主要工作第14页
   ·论文章节安排第14-16页
第二章 双语语料库第16-21页
   ·双语语料库概述第16页
   ·双语网页第16-18页
     ·双语网页分类第16-17页
     ·双语平行网页第17-18页
   ·双语平行网页挖掘的研究第18-21页
     ·双语平行网页挖掘的研究内容第18页
     ·网页标记结构第18-21页
第三章 基于互联网的双语语料挖掘第21-23页
   ·基于互联网的双语语料挖掘研究现状第21页
   ·双语语料挖掘的解决方案第21-23页
     ·候选网页的获取第21-22页
     ·句子对齐第22-23页
第四章 双语网页的获取第23-31页
   ·双语网页的获取方法第23-27页
     ·基于网页的URL命名相似性的获取方法第23-25页
     ·基于网页组织结构相似性的获取方法第25-26页
     ·基于网页命名和组织结构相似性的混合获取方法第26-27页
     ·加入句子对齐结果反馈的获取方法第27页
   ·Linux中wget用法第27-28页
   ·双语网页获取的步骤第28-31页
     ·双语网站的获取第28-29页
     ·双语网页的分类第29页
     ·双语网页的过滤第29-30页
     ·双语网页段落的提取第30-31页
第五章 网页句子对齐第31-46页
   ·句子对齐的定义第31-32页
   ·句子对齐的研究现状第32-34页
     ·基于长度的句子对齐第33页
     ·基于词典的句子对齐第33页
     ·基于关键字的句子对齐第33-34页
     ·综合利用长度、词典、关键字信息的句子对齐第34页
   ·中英文网页句子的特点第34-35页
     ·中英文句子的特点第34页
     ·网页的特点第34-35页
   ·中英文网页句子对齐系统模型第35-42页
     ·中英文网页句子对齐系统模型的设计第35-40页
     ·模型实现第40-42页
   ·对齐结果的存储第42-46页
     ·TMX文档结构第42-45页
     ·TMX实施级别第45-46页
第六章 实验结果与分析第46-50页
   ·实验条件及参数第46-47页
   ·对中英文网页句子对齐系统实验结果的分析第47-49页
     ·实验结果的初步分析第47-48页
     ·文本长度对中英文网页句子对齐系统实验结果的影响第48页
     ·人工调整参数反馈对齐结果对中英文网页句子对齐系统实验结果的影响第48-49页
   ·实验结果总结第49-50页
第七章 总结与展望第50-52页
   ·总结第50页
   ·展望第50-52页
缩略语第52-53页
攻读硕士学位期间发表的学术论文及参与项目第53-54页
参考文献第54-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:基于软件缺陷分类标准与分析技术的软件缺陷管理系统应用与研究
下一篇:利用虚拟现实技术实现E-Learning教学系统中的实验功能