首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

深网数据爬取关键技术研究

摘要第5-6页
abstract第6-7页
第一章 绪论第13-20页
    1.1 研究背景和意义第13-14页
    1.2 研究历史与现状第14-18页
        1.2.1 深网数据爬取第14-15页
        1.2.2 深网查询接口发现第15-17页
        1.2.3 深网查询接口模式提取第17-18页
    1.3 论文研究内容第18-19页
    1.4 论文结构安排第19-20页
第二章 深网相关技术研究第20-33页
    2.1 Web网页设计技术基础第20-24页
        2.1.1 HTML标签语言第20-22页
        2.1.2 DOM模型第22-23页
        2.1.3 JavaScript脚本语言第23-24页
    2.2 深网信息提取技术第24-25页
    2.3 深网查询接口发现方法第25-30页
        2.3.1 网页交互接口定位第25-26页
        2.3.2 深网查询接口识别第26-29页
        2.3.3 深网查询接口分类第29-30页
    2.4 深网查询接口模式抽取方法第30-32页
    2.5 本章小结第32-33页
第三章 深网查询接口发现方法研究第33-58页
    3.1 基于视觉信息的网页交互接口定位方法第33-45页
        3.1.1 基于布局引擎的网页渲染第34-35页
        3.1.2 基于视觉信息的布局分块第35-39页
        3.1.3 基于内容相关性的分块剪枝第39-41页
        3.1.4 基于空间布局的分块重构第41-45页
    3.2 基于统计特征的深网查询接口识别方法第45-52页
        3.2.1 网页交互接口结构特征提取第45-48页
        3.2.2 网页交互接口文本特征提取第48-52页
    3.3 实验测试与分析第52-57页
        3.3.1 网页交互接口定位方法测试第52-55页
        3.3.2 深网查询接口识别方法测试第55-57页
    3.4 本章小结第57-58页
第四章 深网查询接口模式抽取方法研究第58-80页
    4.1 三阶段查询接口模式抽取方法框架第58-61页
    4.2 基于层次聚类的元素树构建方法第61-68页
        4.2.1 基于HTML布局标签的区域分割第62-64页
        4.2.2 基于层次聚类的元素树构建第64-68页
    4.3 基于启发式规则的语义标签匹配方法第68-73页
        4.3.1 基于空间布局特征的标签匹配规则第68-69页
        4.3.2 基于文本样式特征的标签匹配规则第69页
        4.3.3 基于启发式规则的标签匹配第69-73页
    4.4 深网查询接口元信息提取第73-74页
    4.5 实验测试与分析第74-79页
        4.5.1 元素树分组关系测试第75-77页
        4.5.2 标签匹配测试第77-79页
    4.6 本章小结第79-80页
第五章 全文总结和展望第80-82页
    5.1 全文总结第80-81页
    5.2 后续工作展望第81-82页
致谢第82-83页
参考文献第83-86页
攻硕期间取得的研究成果第86页

论文共86页,点击 下载论文
上一篇:动态场景的无鬼影高动态范围图像生成研究
下一篇:社交媒体中的用户情感极性分析方法研究