首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于树自动机的Web信息抽取

摘要第1-4页
ABSTRACT第4-7页
第一章 绪论第7-12页
   ·研究背景第7-8页
   ·Web信息抽取研究现状第8-10页
     ·国外研究现状第8-9页
     ·国内研究现状第9-10页
   ·论文的组织结构第10-12页
第二章 相关技术第12-20页
   ·Web信息抽取技术第12-15页
     ·Web信息抽取技术的分类第12-14页
     ·信息抽取的评价指标第14-15页
   ·自动机技术第15-18页
     ·文法推理第15页
     ·自动机技术第15-16页
     ·树自动机第16-17页
     ·文法推理的信息抽取第17-18页
   ·HTML、XHTML和XML第18-19页
     ·HTML第18页
     ·XHTML第18-19页
     ·XML第19页
   ·本章小结第19-20页
第三章 信息抽取的方法和算法第20-37页
   ·预处理第20-22页
   ·将无秩树转化为有秩树第22-23页
   ·抽取方法第23-25页
   ·树自动机推理算法第25-31页
     ·定义第25-26页
     ·k-testable算法第26-27页
     ·g-testable算法第27-28页
     ·gl-testable算法第28-31页
   ·系统设计目标第31-33页
     ·系统中信息表示模型的选取第31页
     ·系统总体设计思想第31-33页
   ·Web文档准备阶段第33-35页
     ·Web到DOM树的转化第33-35页
   ·Web文档信息抽取阶段第35页
   ·本章小结第35-37页
第四章 实验结果及其分析第37-45页
   ·基准数据集的测试第37-42页
     ·实验结果的比较第38-39页
     ·实验结果详细分析第39-42页
   ·大型数据集中的测试第42-44页
   ·本章小结第44-45页
第五章 论文总结与展望第45-47页
   ·总结第45页
   ·展望第45-47页
参考文献第47-52页
个人简历 在读期间发表的学术论文第52-53页
致谢第53页

论文共53页,点击 下载论文
上一篇:复杂环境下基于多特征融合的车辆检测方法研究
下一篇:IEEE1588网络的时钟同步技术及流量拥塞预报模型研究