首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web信息抽取技术的研究与应用

摘要第1-5页
ABSTRACT第5-6页
创新点摘要第6-9页
前言第9-10页
第一章 绪论第10-21页
   ·信息抽取技术概述第10-14页
     ·信息抽取发展历史及研究现状第10-11页
     ·信息抽取系统的两大设计方法第11-12页
     ·信息抽取文本的分类第12-13页
     ·信息抽取技术的评价指标第13-14页
   ·信息抽取方法分类第14-16页
     ·按照自动化程度分类第14页
     ·按照抽取技术路线的分类第14-16页
   ·WEB信息抽取技术研究第16-18页
   ·信息抽取的发展趋势第18-19页
   ·本文的研究内容第19-21页
第二章 抽取规则描述第21-29页
   ·抽取规则第21-24页
     ·抽取规则定义第21-22页
     ·典型抽取工具的规则描述第22-24页
   ·正则表达式的概述第24-28页
     ·正则表达式的定义第24-26页
     ·正则表达式的测试第26页
     ·页面清理第26-28页
   ·小结第28-29页
第三章 基于规则的WEB信息抽取第29-38页
   ·WEB信息抽取相关技术第29-30页
   ·基于规则的WEB信息抽取第30-36页
     ·系统流程第30-32页
     ·DOM树生成算法第32-34页
     ·抽取规则生成及抽取执行第34-35页
     ·数据处理模块第35-36页
   ·实验结果第36页
   ·小结第36-38页
第四章 基于时间频率加权DOM的WEB信息抽取第38-49页
   ·相关定义及技术第38-42页
     ·基本定义第38-39页
     ·HTML解析器第39-42页
   ·基于TFW-DOM的WEB信息抽取概述第42-48页
     ·DOM树的遍历算法第43-44页
     ·页面清理模块第44-46页
     ·DOM树加权第46-47页
     ·计算抽取时间算法第47-48页
   ·实验结果第48页
   ·小结第48-49页
结论第49-50页
参考文献第50-54页
发表文章目录第54-55页
致谢第55-56页
详细摘要第56-66页

论文共66页,点击 下载论文
上一篇:基于IPS的检测引擎的研究与设计
下一篇:基于角色的数据交换模式的研究