首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web信息抽取规则的设计和实现

摘要第1-7页
Abstract第7-11页
第一章 绪论第11-16页
   ·研究背景第11-12页
   ·相关研究工作现状第12-13页
   ·本文主要工作第13-14页
   ·本文的内容组织第14-16页
第二章 Web信息抽取的基本过程和模型第16-24页
   ·全过程化Web信息抽取模型第16-17页
   ·网页浏览导航过程和模型第17-18页
   ·网页数据抽取过程和模型第18-21页
   ·数据集成处理过程和模型第21-24页
     ·ETI集成处理过程和模型第21-22页
     ·数据集成目标数据模型第22-24页
第三章 抽取规则语言的设计与实现第24-39页
   ·抽取规则体系和语言的基本设计目标和结构第24页
   ·抽取规则语言的设计第24-25页
   ·页面模型第25-26页
   ·规则语言描述和数据源描述控件第26-32页
   ·页面数据记录到目标数据记录的转换集成脚本语言第32-33页
   ·浏览导航链接跳转和多网页数据记录关系的维护第33-35页
   ·抽取规则执行的总流程第35-36页
   ·预编译第36-39页
第四章 基于小样本学习的文本抽取规则自动生成第39-55页
   ·文本抽取规则第39-40页
     ·引入文本抽取规则的原因第39-40页
     ·文本抽取规则的生成第40页
   ·相关工作第40-41页
   ·算法的主要步骤第41-42页
   ·迭代式多序列比对第42-46页
     ·核心序列法第43-45页
     ·迭代式核心序列法第45-46页
   ·模板推导和文本抽取规则生成第46-50页
     ·计算栏的信息熵第46-48页
     ·多模板的处理第48-50页
   ·应用文本抽取规则抽取字段第50-51页
   ·实验结果第51-53页
   ·相关定理的证明第53-55页
第五章 抽取规则的生成第55-61页
   ·多种抽取处理方法的融合与抽取规则的生成第55-56页
   ·基于Web数据记录挖掘的结果辅助生成抽取规则第56-61页
     ·Web数据记录挖掘简介第56-57页
     ·根据记录挖掘的结果生成抽取规则第57-61页
第六章 总结与进一步工作第61-63页
   ·本文总结第61页
   ·进一步的研究工作第61-63页
参考文献第63-66页
致谢第66-67页
附录第67-68页

论文共68页,点击 下载论文
上一篇:中药方剂核心药物及其配伍规律挖掘
下一篇:基于OSGI的搜索引擎营销效果监控系统设计与实现