首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--自动化系统论文--数据处理、数据处理系统论文

汽车票务Deep Web数据采集关键技术研究

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-16页
    1.1 选题背景及意义第9-10页
    1.2 国内外研究现状第10-13页
        1.2.1 网页结构相似性度量第10-11页
        1.2.2 Deep Web查询接口分类第11-13页
        1.2.3 Deep Web数据集成第13页
    1.3 本文研究内容与组织结构第13-16页
        1.3.1 研究内容第13-14页
        1.3.2 组织结构第14-16页
第二章 网页预处理与数据采集系统概述第16-24页
    2.1 JAVA分析工具及网页预处理第16-19页
        2.1.1 JAVA分析工具第16-18页
        2.1.2 网页噪声预处理第18-19页
    2.2 Deep Web数据采集系统基础概述第19-23页
        2.2.1 Web技术概述第19-20页
        2.2.2 超文本传输协议HTTP简介第20-22页
        2.2.3 Deep Web第22页
        2.2.4 Web网页启发式抽取规则第22-23页
    2.3 本章小结第23-24页
第三章 汽车票务网查询页面识别算法研究第24-51页
    3.1 网页结构相似性度量第24-26页
        3.1.1 树编辑距离算法第24-25页
        3.1.2 简单树匹配算法第25-26页
        3.1.3 树路径匹配算法第26页
    3.2 网页结构标签树及邻接矩阵第26-33页
        3.2.1 网页结构标签树第26-31页
        3.2.2 生成标签树邻接矩阵第31-33页
    3.3 汽车票务网查询页面识别算法第33-38页
        3.3.1 候选目标数据区域特征提取及定位第33-34页
        3.3.2 邻接矩阵结构相似性算法第34-38页
    3.4 实验与分析第38-50页
    3.5 本章小结第50-51页
第四章 Deep Web网页查询接口分类算法研究第51-71页
    4.1 决策树分类模型第51-55页
        4.1.1 监督学习基本概念第51-52页
        4.1.2 决策树归纳学习算法第52-54页
        4.1.3 混杂度函数第54-55页
    4.2 汽车票务查询接口决策树分类模型研究第55-65页
        4.2.1 查询接口决策属性归纳第55-56页
        4.2.2 查询接口分类训练数据预处理第56-57页
        4.2.3 查询接口决策树分类模型第57-61页
        4.2.4 查询接口决策树分类模型改进第61-65页
    4.3 实验与分析第65-70页
    4.4 本章小结第70-71页
第五章 汽车票务Deep Web数据采集原型系统设计第71-83页
    5.1 系统介绍第71-72页
    5.2 系统总体设计第72-75页
        5.2.1 系统框架第72-73页
        5.2.2 系统功能模块第73-75页
    5.3 系统核心模块设计第75-82页
        5.3.1 主题爬虫模块第75-76页
        5.3.2 查询接口分类模块第76-77页
        5.3.3 Deep Web数据抓取模块第77-81页
        5.3.4 Deep Web数据抽取模块第81-82页
    5.4 本章小结第82-83页
第六章 总结与展望第83-85页
    6.1 论文总结第83-84页
    6.2 展望第84-85页
致谢第85-86页
参考文献第86-89页
攻读硕士学位期间取得的研究成果第89页

论文共89页,点击 下载论文
上一篇:食品安全规制体制影响食品安全的机理与对策
下一篇:分数阶系统的稳定性分析与控制器设计