首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于互联网文本数据的特定领域双语词典抽取

摘要第1-5页
Abstract第5-8页
表目录第8-10页
图目录第10-11页
第一章 绪论第11-17页
 1.1 研究背景第11-13页
 1.2 研究主题与目标第13-14页
 1.3 论文主要工作第14页
 1.4 论文组织结构第14-17页
第二章 研究现状第17-27页
 2.1 基于平行语料的双语词典抽取第17-20页
 2.2 基于非平行语料的双语词典抽取第20-25页
 2.3 小结第25-27页
第三章 系统设计第27-31页
 3.1 基本原理第27-28页
 3.2 系统结构第28-30页
  3.2.1 特定领域多语语料采集第28-29页
  3.2.2 双语词典的获取第29-30页
 3.3 小结第30-31页
第四章 特定领域多语语料的采集第31-41页
 4.1 简介第31-32页
 4.2 语料采集种子词的确定第32-33页
 4.3 相关文档的检索与下载第33-34页
 4.4 语料分析第34-36页
 4.5 语料内容预处理第36-39页
  4.5.1 基本方法第36页
  4.5.2 HTML树结构的遍历第36-37页
  4.5.3 对节点的处理第37-39页
  4.5.4 编码转换第39页
 4.6 小结第39-41页
第五章 特定领域双语词典的抽取第41-65页
 5.1 基本原理第41-43页
  5.1.1 基于混合语料的双语词典抽取基本原理第41页
  5.1.2 基于非平行语料的双语词典抽取基本原理第41-43页
 5.2 基于混合语料的双语词典抽取第43-47页
  5.2.1 基于词条对照语料的双语词典抽取第43-46页
  5.2.2 基于注释类语料的双语词典抽取第46-47页
 5.3 基于非平行语料的双语词典抽取第47-63页
  5.3.1 语料预处理第47-53页
  5.3.2 种子词选择第53-55页
  5.3.3 共现统计及相关度计算第55-60页
  5.3.4 相似度计算第60-63页
 5.4 小结第63-65页
第六章 实验结果与讨论第65-77页
 6.1 实验数据第65页
 6.2 实验结果分析第65-76页
  6.2.1 词典抽取结果正确率分析第65-67页
  6.2.2 种子词选择对词典抽取结果的影响第67-71页
  6.2.3 词典抽取结果应用于跨语言信息检索中的实验结果第71-76页
 6.3 小结第76-77页
第七章 结束语第77-79页
 7.1 主要成果第77页
 7.2 工作展望第77-79页
参考文献第79-85页
攻读硕士学位期间发表论文第85-87页
致谢第87页

论文共87页,点击 下载论文
上一篇:小型直链淀粉测定仪的设计与开发
下一篇:论证据的证明力——以民事诉讼为视角