从互联网上挖掘双语语料的研究与实现

论文摘要	第1-7页
ABSTRACT	第7-12页
第一章绪论	第12-16页
·背景概述	第12-14页
·主要工作	第14页
·论文章节安排	第14-16页
第二章双语语料库	第16-21页
·双语语料库概述	第16页
·双语网页	第16-18页
·双语网页分类	第16-17页
·双语平行网页	第17-18页
·双语平行网页挖掘的研究	第18-21页
·双语平行网页挖掘的研究内容	第18页
·网页标记结构	第18-21页
第三章基于互联网的双语语料挖掘	第21-23页
·基于互联网的双语语料挖掘研究现状	第21页
·双语语料挖掘的解决方案	第21-23页
·候选网页的获取	第21-22页
·句子对齐	第22-23页
第四章双语网页的获取	第23-31页
·双语网页的获取方法	第23-27页
·基于网页的URL命名相似性的获取方法	第23-25页
·基于网页组织结构相似性的获取方法	第25-26页
·基于网页命名和组织结构相似性的混合获取方法	第26-27页
·加入句子对齐结果反馈的获取方法	第27页
·Linux中wget用法	第27-28页
·双语网页获取的步骤	第28-31页
·双语网站的获取	第28-29页
·双语网页的分类	第29页
·双语网页的过滤	第29-30页
·双语网页段落的提取	第30-31页
第五章网页句子对齐	第31-46页
·句子对齐的定义	第31-32页
·句子对齐的研究现状	第32-34页
·基于长度的句子对齐	第33页
·基于词典的句子对齐	第33页
·基于关键字的句子对齐	第33-34页
·综合利用长度、词典、关键字信息的句子对齐	第34页
·中英文网页句子的特点	第34-35页
·中英文句子的特点	第34页
·网页的特点	第34-35页
·中英文网页句子对齐系统模型	第35-42页
·中英文网页句子对齐系统模型的设计	第35-40页
·模型实现	第40-42页
·对齐结果的存储	第42-46页
·TMX文档结构	第42-45页
·TMX实施级别	第45-46页
第六章实验结果与分析	第46-50页
·实验条件及参数	第46-47页
·对中英文网页句子对齐系统实验结果的分析	第47-49页
·实验结果的初步分析	第47-48页
·文本长度对中英文网页句子对齐系统实验结果的影响	第48页
·人工调整参数反馈对齐结果对中英文网页句子对齐系统实验结果的影响	第48-49页
·实验结果总结	第49-50页
第七章总结与展望	第50-52页
·总结	第50页
·展望	第50-52页
缩略语	第52-53页
攻读硕士学位期间发表的学术论文及参与项目	第53-54页
参考文献	第54-58页
致谢	第58页