首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

双语语料获取系统关键技术的研究与实现

摘要第1-6页
ABSTRACT第6-11页
第1章 引言第11-18页
   ·研究背景第11-13页
   ·双语语料建设现状第13-15页
     ·国内研究现状第13-15页
     ·国外研究现状第15页
   ·主要研究目标和研究内容第15-18页
     ·研究目标第15-16页
     ·研究内容第16-18页
第2章 相关开源工具介绍第18-25页
   ·爬虫开源工具 NUTCH第18-23页
     ·Nutch 的技术背景介绍第18-19页
     ·Nutch 网络爬虫第19-22页
     ·基于 Nutch 查询的实现第22-23页
   ·开源工具 LEMUR第23-24页
     ·Lemur 概述第23页
     ·Lemur 特点第23-24页
   ·本章小结第24-25页
第3章 需求分析与总体设计第25-33页
   ·需求分析第25-28页
     ·机器翻译第25页
     ·跨语言信息检索第25-27页
     ·平行语料库的构建第27-28页
     ·基于 Web 构建大规模平行语料库第28页
   ·总体设计第28-32页
     ·设计概述第28-30页
     ·总体设计第30-32页
   ·本章小结第32-33页
第4章 面向爱词霸的双语语料获取模块的实现第33-41页
   ·获取双语语料的基本流程第33-35页
   ·双语语料自动获取的前期准备工作第35页
     ·抓取网站第35页
     ·抓取底表的制定第35页
   ·基于爱词霸的双语语料获取第35-38页
     ·网页的处理第36页
     ·句子对齐第36-38页
   ·“爱词霸”基于模板匹配的双语语料自动获取第38-39页
   ·本章小结第39-41页
第5章 面向中国期刊网的大规模双语语料获取模块的实现第41-64页
   ·基于 WEB 的语料库获取系统概况第41-45页
     ·现有研究介绍第42-43页
     ·各系统比较第43-45页
   ·面向中国期刊网的双语语料获取第45-48页
     ·中国期刊全文数据库页面信息分析第45-46页
     ·中国期刊全文数据库结构分析第46-48页
   ·基本流程第48-50页
   ·双语语料的获取第50-56页
     ·期刊总目录的获取第50-53页
     ·双语网页的获取第53-56页
   ·双语平行语料自动获取的实现第56-60页
     ·系统的主要模块介绍第56-57页
     ·模块间的数据传输第57-58页
     ·数据库设计第58-60页
   ·双语平行句对的获取第60-63页
     ·双语平行句对分析第60-61页
     ·难点分析与解决方案第61-62页
     ·事务功能第62-63页
   ·本章小结第63-64页
第6章 面向专利查询的大规模双语语料获取的功能模块第64-73页
   ·专利网站的分析第64-67页
   ·专利网站的相关研究第67-68页
   ·解决的关键问题第68-69页
   ·专利平行语料的自动获取第69-71页
     ·中文专利数据的自动获取第69页
     ·数据的下载第69-70页
     ·英文专利数据的自动获取第70-71页
   ·处理流程第71-72页
   ·本章小结第72-73页
第7章 实验结果与软件测试第73-82页
   ·面向爱词霸网站的双语语料获取第73-74页
     ·实验环境第73页
     ·实验结果第73-74页
     ·评测指标第74页
   ·面向中国期刊网的双语语料获取第74-76页
     ·系统性能介绍第74-75页
     ·系统成果第75-76页
   ·面向专利的大规模双语语料获取第76-77页
   ·获取的双语对齐语料在跨语言信息检索中的应用效果第77-81页
   ·本章小结第81-82页
结论第82-84页
致谢第84-85页
参考文献第85-88页

论文共88页,点击 下载论文
上一篇:价格监督举报管理系统的设计与实现
下一篇:基于CAN总线的现场总线继电器研究