首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

Web漏洞扫描系统中的智能爬虫技术研究

摘要第1-6页
ABSTRACT第6-9页
第一章 绪论第9-14页
   ·选题的背景第9-10页
   ·国内外研究现状及意义第10-12页
     ·研究现状第10-12页
     ·研究意义第12页
   ·论文的主要内容与组织结构第12-14页
第二章 网络爬虫相关技术第14-22页
   ·网络爬虫基本概念第14页
   ·网页抓取策略第14-15页
     ·深度优先策略第14-15页
     ·广度优先策略第15页
     ·最佳优先策略第15页
   ·网络爬虫分类第15-20页
     ·通用爬虫第15-16页
     ·聚焦爬虫第16-19页
     ·深度爬虫第19-20页
   ·Web 漏洞扫描系统中的爬虫第20-21页
   ·本章小结第21-22页
第三章 智能爬虫的爬行策略探索第22-31页
   ·Web 漏洞扫描系统概述第22-23页
   ·基于属性标签的 Web 数据挖掘第23-24页
     ·已有 Web 数据挖掘的方法第23-24页
     ·基于属性标签的 Web 数据挖掘的方法提出第24页
   ·建立带属性标签的 DOM 树第24-25页
     ·HTML 页面预处理第25页
     ·建立 DOM 树第25页
   ·挖掘数据域第25-30页
     ·识别重复模式第26-28页
     ·排除干扰重复模式第28页
     ·重要性函数第28-30页
   ·实验与分析第30页
   ·本章小结第30-31页
第四章 应用于 Web 数据挖掘的编辑距离第31-44页
   ·树结构编辑距离第31-38页
     ·树的编辑配对第32-33页
     ·树编辑距离的算法第33-37页
     ·空间复杂度分析第37页
     ·时间复杂度分析第37-38页
   ·字符串编辑距离第38-42页
     ·字符串编辑距离第38-40页
     ·字符串编辑距离算法第40页
     ·算法改进第40-41页
     ·算法优化第41-42页
     ·相似度函数第42页
   ·实验与分析第42-43页
   ·本章小结第43-44页
第五章 智能爬虫设计与实现第44-57页
   ·智能爬虫设计第44-45页
     ·编程环境第44-45页
     ·智能爬虫概述第45页
   ·下载页面收集模块第45-48页
     ·模块详述第45-46页
     ·实验演示第46-48页
   ·解析模块第48-51页
   ·提取 URL 模块第51-55页
     ·基于属性标签的 Web 数据挖掘算法实现第51-54页
     ·基于属性标签的 Web 数据挖掘算法演示第54页
     ·基于编辑距离的 Web 数据挖掘算法实现第54-55页
     ·基于编辑距离的 Web 数据挖掘算法演示第55页
   ·本章小结第55-57页
第六章 总结与展望第57-59页
致谢第59-60页
参考文献第60-64页
附录第64页

论文共64页,点击 下载论文
上一篇:供应链网络结构稳定性仿真研究
下一篇:高扩频比直扩系统中的解扩及同步技术的研究