首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

基于序列比对的动态Web信息抽取算法研究

提要第1-8页
第1章 绪论第8-14页
   ·论文的研究背景第8页
   ·信息抽取研究的发展历史第8-10页
   ·信息抽取技术的研究现状第10-12页
   ·本文的主要内容和组织第12-14页
第2章 Web 信息抽取概述第14-27页
   ·Web 信息抽取定义第14-15页
   ·Web 信息抽取的产生与发展第15-16页
   ·Web 信息抽取的技术分类第16-20页
     ·基于自然语言处理方式的信息抽取第16-17页
     ·基于归纳学习的信息抽取第17页
     ·基于HTML 结构的信息抽取第17-18页
     ·基于自定义查询语言的信息抽取第18-19页
     ·基于页面视觉特征的信息抽取第19页
     ·基于本体论信息抽取第19-20页
   ·Web 信息抽取的自动化程度分类第20-22页
     ·手工式Web 信息抽取第20页
     ·有监督的Web 信息抽取第20页
     ·半监督的Web 信息抽取第20-21页
     ·无监督的Web 信息抽取第21-22页
   ·不同抽取技术的对比分析第22-23页
   ·Web 信息抽取技术与其它相关技术的比较第23-25页
     ·与Web 信息检索比较第24页
     ·与自动文摘比较第24页
     ·与Web 文本挖掘比较第24-25页
   ·目前Web信息抽取研究的不足第25-27页
第3章 基于序列比对的动态Web 页面信息抽取算法第27-45页
   ·问题描述及算法流程第27-29页
     ·Web 网页描述第27-28页
     ·算法流程第28-29页
   ·公共框架检测第29-35页
     ·公共框架检测相关定义第29-30页
     ·序列比对相关定义第30-31页
     ·序列比对结果的评价标准第31页
     ·序列比对算法分类第31-34页
     ·本文使用的序列比对算法第34-35页
   ·模板抽取第35-45页
     ·动态Web 信息抽取第35-39页
     ·模板抽取相关定义第39页
     ·模板抽取理论基础第39-40页
     ·自动抽取问题的形式化描述第40-41页
     ·模板抽取算法第41-43页
     ·数据存储第43-45页
第4章 实验结果与分析第45-54页
   ·评价标准第45-46页
   ·实验设计与分析第46-53页
     ·测试样本第46-47页
     ·实验结果第47-53页
   ·小结第53-54页
第5章 结论第54-56页
   ·总结第54页
   ·下一步工作第54-56页
参考文献第56-61页
攻读硕士期间发表的学术论文第61-62页
致谢第62-63页
摘要第63-66页
ABSTRACT第66-68页

论文共68页,点击 下载论文
上一篇:支持向量聚类算法及其在医学数据分析中的应用
下一篇:一种像素级的图像篡改定位和恢复的脆弱水印算法