论文摘要 | 第1-7页 |
ABSTRACT | 第7-12页 |
第一章 绪论 | 第12-16页 |
·背景概述 | 第12-14页 |
·主要工作 | 第14页 |
·论文章节安排 | 第14-16页 |
第二章 双语语料库 | 第16-21页 |
·双语语料库概述 | 第16页 |
·双语网页 | 第16-18页 |
·双语网页分类 | 第16-17页 |
·双语平行网页 | 第17-18页 |
·双语平行网页挖掘的研究 | 第18-21页 |
·双语平行网页挖掘的研究内容 | 第18页 |
·网页标记结构 | 第18-21页 |
第三章 基于互联网的双语语料挖掘 | 第21-23页 |
·基于互联网的双语语料挖掘研究现状 | 第21页 |
·双语语料挖掘的解决方案 | 第21-23页 |
·候选网页的获取 | 第21-22页 |
·句子对齐 | 第22-23页 |
第四章 双语网页的获取 | 第23-31页 |
·双语网页的获取方法 | 第23-27页 |
·基于网页的URL命名相似性的获取方法 | 第23-25页 |
·基于网页组织结构相似性的获取方法 | 第25-26页 |
·基于网页命名和组织结构相似性的混合获取方法 | 第26-27页 |
·加入句子对齐结果反馈的获取方法 | 第27页 |
·Linux中wget用法 | 第27-28页 |
·双语网页获取的步骤 | 第28-31页 |
·双语网站的获取 | 第28-29页 |
·双语网页的分类 | 第29页 |
·双语网页的过滤 | 第29-30页 |
·双语网页段落的提取 | 第30-31页 |
第五章 网页句子对齐 | 第31-46页 |
·句子对齐的定义 | 第31-32页 |
·句子对齐的研究现状 | 第32-34页 |
·基于长度的句子对齐 | 第33页 |
·基于词典的句子对齐 | 第33页 |
·基于关键字的句子对齐 | 第33-34页 |
·综合利用长度、词典、关键字信息的句子对齐 | 第34页 |
·中英文网页句子的特点 | 第34-35页 |
·中英文句子的特点 | 第34页 |
·网页的特点 | 第34-35页 |
·中英文网页句子对齐系统模型 | 第35-42页 |
·中英文网页句子对齐系统模型的设计 | 第35-40页 |
·模型实现 | 第40-42页 |
·对齐结果的存储 | 第42-46页 |
·TMX文档结构 | 第42-45页 |
·TMX实施级别 | 第45-46页 |
第六章 实验结果与分析 | 第46-50页 |
·实验条件及参数 | 第46-47页 |
·对中英文网页句子对齐系统实验结果的分析 | 第47-49页 |
·实验结果的初步分析 | 第47-48页 |
·文本长度对中英文网页句子对齐系统实验结果的影响 | 第48页 |
·人工调整参数反馈对齐结果对中英文网页句子对齐系统实验结果的影响 | 第48-49页 |
·实验结果总结 | 第49-50页 |
第七章 总结与展望 | 第50-52页 |
·总结 | 第50页 |
·展望 | 第50-52页 |
缩略语 | 第52-53页 |
攻读硕士学位期间发表的学术论文及参与项目 | 第53-54页 |
参考文献 | 第54-58页 |
致谢 | 第58页 |