首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

WEB信息抽取的研究

摘要第1-5页
ABSTRACT第5-10页
第1章 引言第10-14页
   ·信息抽取研究背景第10-11页
   ·信息抽取概念及研究现状第11-12页
     ·信息抽取的概念及目的第11页
     ·信息抽取国内外研究现状第11-12页
   ·主要研究内容第12-13页
   ·本章小结第13-14页
第2章 包装器 Wrapper 及相关技术第14-20页
   ·概述第14页
   ·网页结构的特点第14-15页
   ·网页技术简介第15-18页
     ·HTML 介绍第15页
     ·XML 介绍第15-16页
     ·DOM 树介绍第16页
     ·XPATH 介绍第16-18页
   ·包装器介绍第18-19页
   ·本章小结第19-20页
第3章 传统的包装器抽取规则第20-26页
   ·相关抽取技术介绍第20-22页
     ·手工方式抽取第20页
     ·基于样本学习的半自动化方式抽取第20-21页
     ·利用页面结构特点的半自动化方式抽取第21页
     ·其他方式的模式抽取第21-22页
   ·EWDT 的抽取规则第22-25页
     ·信息抽取的基本原理第22-23页
     ·抽取规则与算法第23-24页
     ·衡量指标与结论第24-25页
   ·本章小结第25-26页
第4章 TSND 包装器抽取规则及实现第26-42页
   ·预处理过程第27-28页
   ·构造框架结构体第28-29页
     ·HTML 路径和结构体的定义第28页
     ·框架结构体的生成第28-29页
   ·主结构体的构造第29-31页
     ·结构体分割算法第29-31页
     ·主结构体的构造第31页
   ·准确链接组生成第31-32页
   ·结构体集合的构造第32-33页
   ·Wrapper 的抽取公式第33页
   ·抽取规则的维护第33-34页
   ·包装器的设计与实现第34-39页
     ·包装器系统分析第34页
     ·信息抽取包装器的框架结构第34-36页
     ·包装器的实现第36-39页
   ·试验和结果分析第39-41页
   ·本章小结第41-42页
第5章 总结与展望第42-44页
   ·本文总结第42页
   ·未来工作的展望第42-44页
参考文献第44-47页
致谢第47-48页
附录第48页

论文共48页,点击 下载论文
上一篇:高校排课系统的研究
下一篇:基于STb7100的DVB-T机顶盒软件系统的研究与实现