首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Web的双语资源信息抽取研究

摘要第1-4页
Abstract第4-7页
第一章 绪论第7-12页
   ·语料库的定义与应用第7-8页
     ·语料库的定义和分类第7-8页
     ·双语平行语料库第8页
   ·信息抽取研究的背景第8-11页
     ·信息抽取的历史与现状第8-11页
     ·信息抽取与信息检索的区别第11页
   ·本文讨论的主要问题第11-12页
第二章 因特网语料下载分析及噪音过滤第12-22页
   ·语料下载程序第12-16页
     ·语料下载程序的设计思想第13页
     ·语料下载程序的关键步骤第13-16页
   ·网页分析程序第16-18页
     ·HTML 网页解析第16-17页
     ·网页对象识别方法第17-18页
   ·基于分块的网页正文信息抽取算法第18-20页
     ·网页噪声分析第18-19页
     ·分块算法描述第19-20页
   ·本章小结第20-22页
第三章 双语资源的导入、整理和加工第22-32页
   ·语料样本的著作权第22页
   ·语料数据导入第22-23页
   ·对齐与分词处理第23-27页
     ·句子对齐第24-25页
     ·句子分词第25-27页
   ·实例分析第27-31页
     ·双语网页对齐第27-29页
     ·中文分词功能的实现第29-31页
   ·本章小结第31-32页
第四章 信息抽取系统的实现与评价第32-41页
   ·信息抽取系统的功能模块第32页
   ·信息抽取关键技术的实现第32-37页
     ·命名实体识别模块第32-34页
     ·句法分析模块第34页
     ·篇章分析与推理模块第34-35页
     ·知识获取模块第35-36页
     ·分装器设计与实现第36-37页
   ·评价信息抽取系统第37-38页
     ·应用 MUC 评价体系第37-38页
     ·应用 ACE 评价体系第38页
   ·信息抽取算法的研究第38-40页
   ·本章小结第40-41页
第五章 WEB信息抽取的应用第41-47页
   ·抽取双语词汇与术语定义第41-43页
     ·识别可能的词对第41-42页
     ·抽取术语:识别多词等价形式第42-43页
   ·抽取翻译模板第43-46页
     ·翻译模板的定义第43-44页
     ·模板生成第44页
     ·过滤第44-45页
     ·评分和选取第45-46页
   ·本章小结第46-47页
第六章 总结与展望第47-48页
参考文献第48-51页
致谢第51页

论文共51页,点击 下载论文
上一篇:电子商务网站设计学习系统的实现
下一篇:网络教育评估理论与实证研究