首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向领域的Web数据集成中数据抽取的研究

摘要第1-10页
ABSTRACT第10-12页
第一章 绪论第12-16页
   ·研究背景第12-14页
   ·本文所做的主要工作第14-15页
   ·本文的结构第15-16页
第二章 Web数据抽取技术的相关研究第16-21页
   ·Web数据抽取技术第16-18页
   ·Web数据抽取方法的研究现状第18-20页
   ·本章小结第20-21页
第三章 面向领域的Web数据抽取系统第21-35页
   ·面向领域的Web数据抽取系统模型DWEXT第21-22页
   ·DWEXT系统架构组成第22-33页
     ·获取标签层第22-23页
     ·数据源层第23-24页
     ·预处理层第24页
     ·数据抽取层第24-28页
     ·标签分配层第28-31页
     ·应用层第31-33页
   ·相关定义第33-34页
   ·本章小结第34-35页
第四章 标签识别第35-45页
   ·Web Form标签的抽取第35-43页
   ·识别列表页面中的标签第43-44页
   ·本章小结第44-45页
第五章 数据抽取第45-65页
   ·数据区域的识别第45-50页
   ·划分数据记录第50-55页
     ·Simple Tree Matching算法第50-52页
     ·划分过程第52-55页
   ·数据抽取器的生成第55-64页
   ·本章小结第64-65页
第六章 实验分析第65-76页
   ·抽取的度量指标第65页
   ·DWEXT系统的开发第65-66页
   ·实验结果第66-75页
     ·标签识别的实验分析第66-69页
     ·数据抽取的实验分析第69-73页
     ·DWEXT系统的实验分析第73-75页
   ·本章小结第75-76页
第七章 总结和展望第76-79页
   ·本文的工作总结第76-77页
   ·未来工作展望第77-79页
参考文献第79-83页
致谢第83-84页
攻读硕士学位期间发表的学术论文第84-85页
学位论文评阅及答辩情况表第85页

论文共85页,点击 下载论文
上一篇:面向主题的舆情采集搜索爬虫的设计与实现
下一篇:遗传算法在Web数据同步抽取中的分析应用