首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向Deep Web基于网页分块的信息抽取方法研究

摘要第4-5页
Abstract第5页
第一章 绪论第10-17页
    1.1 课题背景与意义第10-11页
    1.2 国内外研究现状第11-14页
        1.2.1 Web信息抽取研究现状第11-12页
        1.2.2 Deep Web研究现状与展望第12-13页
        1.2.3 网页分块研究现状第13-14页
    1.3 论文研究内容第14-15页
    1.4 论文组织结构第15-17页
第二章 Deep Web信息抽取技术简介第17-24页
    2.1 Deep Web信息抽取系统介绍第17页
    2.2 Deep Web信息抽取的几种技术第17-21页
        2.2.1 查询结果处理技术第17-19页
        2.2.2 查询接口语义扩展技术第19-20页
        2.2.3 基于模板和领域本体的信息抽取第20页
        2.2.4 基于视觉的Deep Web信息抽取第20-21页
    2.3 信息抽取方法的优缺点概述第21-22页
    2.4 Deep Web信息抽取方法存在的问题第22页
    2.5 本章小结第22-24页
第三章 基于网页结构的网页分块方法第24-31页
    3.1 网页分块简介第24-25页
        3.1.1 网页分块的提出第24页
        3.1.2 分块网页结构特征第24-25页
    3.2 网页预处理第25页
    3.3 网页分块方法第25-28页
        3.3.1 利用HTML标签分布第25-26页
        3.3.2 利用HTML标签之间的关系第26页
        3.3.3 利用页面视觉特征第26-27页
        3.3.4 利用表格和框架标签第27-28页
    3.4 网页分块的应用第28-30页
        3.4.1 网页消重第29页
        3.4.2 相关网页多层链接第29-30页
        3.4.3 减小索引文件第30页
        3.4.4 提高检索质量第30页
    3.5 本章小节第30-31页
第四章 面向Deep Web基于网页分块的信息抽取第31-45页
    4.1 网页分块的相关技术第31-36页
        4.1.1 Deep Web入口发现第31-32页
        4.1.2 Deep Web网页识别与分类第32-33页
        4.1.3 Deep Web数据集成和融合第33-35页
        4.1.4 网页分块内容分类第35-36页
    4.2 本文网页分块算法第36-40页
        4.2.1 基于分割条的分块第36-37页
        4.2.2 基于标签的分块第37页
        4.2.3 本文算法实现第37-40页
    4.3 相关度分析和聚类第40-43页
        4.3.1 块特征提取第40-41页
        4.3.2 相似度计算第41-42页
        4.3.3 聚类算法第42-43页
    4.4 本章小结第43-45页
第五章 实验系统设计与实现第45-54页
    5.1 开发工具以及实验环境第45页
    5.2 实验系统结构设计第45-49页
        5.2.1 网页预处理第46-47页
        5.2.2 划分内容块第47页
        5.2.3 块特征提取第47-48页
        5.2.4 相似度计算第48页
        5.2.5 聚类第48-49页
    5.3 运行结果及分析第49-53页
    5.4 本章小结第53-54页
总结第54-57页
    主要工作第54-55页
    主要创新点第55页
    存在的问题以及未来的方向第55-57页
参考文献第57-1页
致谢第1-61页

论文共61页,点击 下载论文
上一篇:中国社会自主性的成长与执政党的变革
下一篇:竹纳米纤维素晶须增强聚乳酸复合材料界面结合及强化机理研究