首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Web的信息抽取技术研究

摘要第1-7页
Abstract第7-10页
第1章 绪论第10-14页
   ·研究背景第10-11页
   ·研究意义第11-12页
   ·本文研究内容第12页
   ·论文结构安排第12-14页
第2章 Web信息抽取概述第14-28页
   ·Web信息抽取的发展历史第14-15页
   ·Web信息抽取的定义和Web信息的特点第15-17页
   ·Web信息抽取技术分析第17-26页
     ·基于正则表达式的信息抽取第17-19页
     ·基于自然语言处理的信息抽取第19-20页
     ·基于本体的信息抽取第20-23页
     ·基于包装器归纳的信息抽取第23-25页
     ·基于HTML结构的信息抽取第25-26页
     ·基于Web查询的信息抽取第26页
   ·本章小结第26-28页
第3章 基于XML技术的Web信息抽取第28-38页
   ·概述第28-30页
     ·问题的提出第28页
     ·网页的格式及XML技术的优势第28-30页
   ·Web信息抽取流程第30-31页
   ·相关技术介绍第31-38页
     ·DOM模型第32-34页
     ·XPath第34-38页
第四章 基于XML技术的Web信息抽取的实现第38-66页
   ·Web文档的预处理第38-45页
     ·将HTML文档解析为DOM模型第39页
     ·将HTML文档转换为形式上的XML文档第39-45页
   ·抽取规则第45-53页
     ·抽取规则的设计第45-48页
     ·抽取规则的生成第48-53页
   ·信息抽取第53-57页
   ·附加语义第57-60页
   ·抽取规则的优化第60-66页
     ·利用标记属性进行优化第61-62页
     ·利用标记之间的数量关系进行优化第62-63页
     ·对新闻信息抽取规则进行优化第63-66页
第五章 原型系统和实验第66-72页
   ·原型系统的介绍第66-68页
     ·开发平台和工具第66页
     ·操作界面和功能介绍第66-68页
   ·信息抽取的评价标准第68-69页
   ·实验结果及分析第69-72页
结论第72-74页
 本文总结第72页
 下一步工作第72-74页
致谢第74-75页
参考文献第75-79页
攻读硕士学位期间发表的论文第79页

论文共79页,点击 下载论文
上一篇:基于CORBA的机载通信系统的研究与实现
下一篇:基于LXI的高性能数据采集系统的软件设计与实现