首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于模板与视觉特征的Web数据抽取技术研究

摘要第4-6页
abstract第6-7页
第一章 绪论第10-18页
    1.1 研究背景第10-11页
    1.2 国内外研究现状第11-15页
        1.2.1 Web数据抽取第11-12页
        1.2.2 Web数据模板构造第12-13页
        1.2.3 Web数据融合第13-15页
    1.3 主要研究内容第15-16页
    1.4 论文组织结构第16-18页
第二章 基于视觉的Web数据抽取方法改进第18-39页
    2.1 Web数据抽取相关概念第18-25页
        2.1.1 DOM树与树路径相似度第18-19页
        2.1.2 页面分割算法第19-21页
        2.1.3 谱聚类算法第21-22页
        2.1.4 基于视觉的Web数据抽取方法第22-25页
    2.2 基于视觉与DOM树的Web数据定位与抽取方法第25-35页
        2.2.1 数据区域定位第25-28页
        2.2.2 数据记录定位第28-33页
        2.2.3 数据记录抽取第33-35页
    2.3 实验与分析第35-38页
        2.3.1 查准率对比第36-37页
        2.3.2 查全率对比第37-38页
    2.4 本章小结第38-39页
第三章 非线性拟合Web数据模板构造方法研究第39-53页
    3.1 数据记录分析第39-42页
    3.2 非线性拟合Web数据模板构造方法第42-50页
        3.2.1 属性项特征提取第42-43页
        3.2.2 Web数据模板构造第43-48页
        3.2.3 基于模板的Web数据抽取第48-50页
    3.3 实验与分析第50-52页
        3.3.1 决定系数对比第50页
        3.3.2 抽取性能对比第50-52页
    3.4 本章小结第52-53页
第四章 多源Web数据融合方法研究与改进第53-64页
    4.1 数据融合问题分析第53-54页
    4.2 基于语义的Web数据融合方法第54-61页
        4.2.1 语义相似度算法改进第55-57页
        4.2.2 语义相关度算法改进第57-58页
        4.2.3 多层次语义度量数据融合算法第58-61页
    4.3 实验与分析第61-63页
        4.3.1 相似度对比第61-62页
        4.3.2 融合性能对比第62-63页
    4.4 本章小结第63-64页
第五章 Web数据抽取系统设计与实现第64-75页
    5.1 系统背景与目标第64页
    5.2 系统分析第64-67页
    5.3 系统架构设计第67-72页
        5.3.1 逻辑架构设计第67-69页
        5.3.2 物理架构设计第69-70页
        5.3.3 功能架构设计第70-71页
        5.3.4 运行架构设计第71-72页
    5.4 系统实现第72-74页
    5.5 本章小结第74-75页
第六章 总结与展望第75-77页
    6.1 研究工作总结第75页
    6.2 趋势与展望第75-77页
致谢第77-78页
参考文献第78-81页
攻读硕士学位期间取得的研究成果第81页

论文共81页,点击 下载论文
上一篇:客运数据质量检测与缺失数据修补研究
下一篇:基于结构的图分类算法研究