首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

可比较语料库的研究与构建

摘要第1-5页
Abstract第5-10页
1 绪论第10-17页
   ·课题来源第10页
   ·研究背景第10-13页
     ·语料库第10-11页
     ·基于语料库的自然语言处理技术第11页
     ·平行语料库第11-12页
     ·可比较语料库第12-13页
   ·可比较语料库研究现状第13-14页
     ·基于可比较语料库的应用第13-14页
     ·可比较语料库的构建现状第14页
   ·本文的工作第14-16页
     ·本文的主要研究内容第15页
     ·本文的创新之处第15-16页
   ·本文的组织结构第16-17页
2 增量搜集技术的研究与实现第17-38页
   ·引言第17页
   ·相关研究第17-21页
   ·基于索引页的新网页发现第21-27页
     ·索引页介绍第21-22页
     ·基于网页标签的索引页判别第22-24页
     ·基于索引页的新网页发现第24-27页
   ·基于Heritrix的增量搜集系统第27-35页
     ·Heritrix介绍第27页
     ·选取Heritrix的原因第27-29页
     ·Heritrix增量爬取原理第29-34页
     ·基于Heritrix的增量新网页获取第34-35页
   ·系统测试第35-37页
     ·运行环境第35页
     ·种子 URL第35-36页
     ·文件过滤第36页
     ·运行结果第36-37页
   ·本章小结第37-38页
3 中文未登录词的翻译第38-56页
   ·引言第38页
   ·相关研究第38-41页
     ·基于 Anchor Text的方法第39页
     ·音译方法第39-40页
     ·基于平行语料的方法第40页
     ·基于网络挖掘的方法第40-41页
   ·问题描述第41页
   ·本文提出的未登录词翻译方法第41-53页
     ·未登录词翻译特征分析第42-44页
     ·未登录词和对应翻译词的共现方式分析第44-45页
     ·系统框架第45-53页
   ·实验设计第53-55页
     ·词典资源第53页
     ·测试数据第53-55页
     ·实验结果第55页
   ·本章小结第55-56页
4 可比较语料库的构建架构第56-66页
   ·数据集增量更新部分第56-57页
   ·对齐部分第57-61页
     ·关键词提取模块第57页
     ·关键词翻译模块第57-58页
     ·检索模块第58-60页
     ·文档对齐模块第60-61页
   ·实验结果分析第61-65页
     ·源语言文档集和目标语言文档集第61-62页
     ·实验结果分析第62-65页
   ·本章小结第65-66页
5 结论第66-67页
   ·本文的工作第66页
   ·进一步的研究工作第66-67页
参考文献第67-73页
攻读硕士学位期间发表学术论文情况第73-74页
攻读硕士学位期间参加的科研项目第74-75页
致谢第75-76页

论文共76页,点击 下载论文
上一篇:基于内容的图像检索技术在多类别商品图像检索中的应用
下一篇:中文新词识别研究