首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Web信息大数据分析的信息资产研究与实现

致谢第5-6页
摘要第6-7页
ABSTRACT第7-8页
1 引言第12-17页
    1.1 研究背景及意义第12-13页
        1.1.1 研究背景第12-13页
        1.1.2 研究意义第13页
    1.2 国内外研究现状第13-16页
        1.2.1 Web挖掘技术研究现状第13-14页
        1.2.2 Web爬虫研究现状第14-15页
        1.2.3 基于Web信息的校园网信息资产管理系统第15-16页
    1.3 主要研究内容第16页
    1.4 论文的组织结构第16-17页
2 相关理论及技术研究第17-31页
    2.1 Web挖掘概述第17-20页
        2.1.1 Web挖掘定义第17页
        2.1.2 Web数据挖掘基本流程第17-18页
        2.1.3 Web数据挖掘分类第18-20页
    2.2 Web信息采集技术第20-26页
        2.2.1 网络爬虫原理第20-23页
        2.2.2 线程池技术第23页
        2.2.3 网络扫描探测技术第23-25页
        2.2.4 Web应用服务器信息采集技术第25-26页
    2.3 信息预处理技术第26-29页
        2.3.1 基于DOM的网页解析技术第26-28页
        2.3.2 Java正则表达式模糊匹配第28-29页
    2.4 URL去重算法对比第29-30页
    2.5 本章小结第30-31页
3 需求分析与总体设计第31-42页
    3.1 系统需求分析第31-36页
        3.1.1 系统总体设计原则第31页
        3.1.2 功能需求分析第31-35页
        3.1.3 性能需求分析第35-36页
    3.2 系统总体设计第36-40页
        3.2.1 系统技术选型第36页
        3.2.2 系统总体框架结构图第36-37页
        3.2.3 系统功能模块设计第37-39页
        3.2.4 性能评价指标第39-40页
    3.3 数据库设计第40-41页
        3.3.1 数据库设计原则第40-41页
        3.3.2 数据库表关系图第41页
    3.4 本章小结第41-42页
4 信息资产管理系统的详细设计与实现第42-62页
    4.1 系统总体环境搭建第42-44页
        4.1.1 系统开发环境第42页
        4.1.2 Redis缓存配置第42-43页
        4.1.3 Mysql数据库配置第43页
        4.1.4 Maven依赖管理配置第43-44页
    4.2 信息采集与预处理层的实现第44-56页
        4.2.1 基于线程池的爬虫信息采集模块第44-46页
        4.2.2 Jsoup页面解析技术第46-47页
        4.2.3 Quartz调度框架的使用第47-48页
        4.2.4 SNMP扫描探测模块的实现第48-49页
        4.2.5 Web服务器的参数信息采集第49-50页
        4.2.6 特征匹配算法中黑白名单建立第50-51页
        4.2.7 基于MD5的URL去重算法第51-52页
        4.2.8 基于Simhash的网页去重算法第52-56页
    4.3 可视化展示层的实现第56-61页
        4.3.1 链接分层信息模块第56-57页
        4.3.2 硬件服务器信息模块第57-58页
        4.3.3 服务器系统信息模块第58页
        4.3.4 运行状态监控管理模块第58-59页
        4.3.5 安全情况统计模块第59-60页
        4.3.6 系统权限管理模块第60-61页
    4.4 本章小结第61-62页
5 系统测试与运行分析第62-69页
    5.1 系统测试目标第62页
    5.2 系统测试的内容第62页
    5.3 功能测试用例第62-65页
        5.3.1 系统权限管理测试第62-63页
        5.3.2 链接分层信息模块测试第63-64页
        5.3.3 硬件服务器信息模块测试第64页
        5.3.4 服务器系统信息模块测试第64-65页
        5.3.5 运行状态信息模块测试第65页
        5.3.6 安全情况统计模块测试第65页
    5.4 性能测试评价第65-67页
    5.5 系统运行分析第67-68页
        5.5.1 信息采集预处理层第67页
        5.5.2 可视化管理层第67-68页
    5.6 本章小结第68-69页
6 结论与展望第69-71页
    6.1 结论第69页
    6.2 展望第69-71页
参考文献第71-73页
作者简历第73-75页
学位论文数据集第75页

论文共75页,点击 下载论文
上一篇:决策粗糙集理论的属性约简算法研究
下一篇:临近空间高超声速条件下雷达目标辨识的研究