首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于视觉信息的Deep Web信息自动抽取技术的研究

摘要第6-8页
Abstract第8-9页
1 引言第12-19页
    1.1 研究背景和意义第12页
    1.2 Web 信息抽取技术的发展第12-16页
        1.2.1 概述第12-15页
        1.2.2 面临的问题第15-16页
    1.3 本文研究内容及创新点第16-17页
    1.4 本论文的组织第17-19页
2 决策树分类算法第19-26页
    2.1 决策树简介第19-24页
        2.1.1 决策树的学习算法第20-22页
        2.1.2 问题第22-24页
    2.2 决策树的评估第24页
    2.3 WEKA 工具描述第24-25页
    2.4 小结第25-26页
3 机器学习与规则融合的列表页面抽取第26-45页
    3.1 网页的视觉特征第27-28页
    3.2 Deep Web 页面的视觉化表示第28-32页
    3.3 页面分割算法 VIPS 的概述与应用第32-35页
        3.3.1 VIPS 分割算法第32-34页
        3.3.2 DOM4J 解析 xml 字符串第34-35页
    3.4 数据区域的自动定位第35-40页
        3.4.1 数据区域的视觉特征第35-36页
        3.4.2 机器学习数据区域的判定规则第36-38页
        3.4.3 手工编写规则完成区域节点的筛选第38-40页
    3.5 数据项的对齐并输出第40-43页
        3.5.1 视觉匹配算法第41页
        3.5.2 数据项对齐算法第41-43页
        3.5.3 数据项的对齐示例第43页
    3.6 小结第43-45页
4 列表页面自动抽取系统第45-53页
    4.1 系统简介第45-52页
        4.1.1 实验训练样例的获取第45-46页
        4.1.2 训练集的优化第46-47页
        4.1.3 训练样例的获取第47-48页
        4.1.4 列表页面抽取及过滤第48-50页
        4.1.5 数据项对齐实验结果第50-51页
        4.1.6 分页数据的自动连续抽取第51-52页
    4.2 小结第52-53页
5 总结与展望第53-54页
    5.1 总结第53页
    5.2 展望未来的工作第53-54页
参考文献第54-57页
致谢第57-58页
个人简历第58页
发表的论文第58页
科研成果第58-59页

论文共59页,点击 下载论文
上一篇:基于图像处理的频高图F2层描迹自动解译研究
下一篇:基于最小化局部泛化误差模型的代价敏感分类特征选择的研究及应用