首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

面向舆情的网页敏感度分析系统的设计与实现

摘要第2-3页
Abstract第3-4页
第一章 引言第7-14页
    1.1 研究背景及意义第7-8页
        1.1.1 研究背景第7-8页
        1.1.2 研究意义第8页
    1.2 舆情分析的研究现状第8-12页
        1.2.1 舆情分析的研究现状第8-10页
        1.2.2 敏感词的研究现状第10-12页
    1.3 本文的主要工作和组织安排第12-14页
第二章 网络爬虫第14-25页
    2.1 网络爬虫的原理第14-18页
        2.1.1 URL的选择第15-16页
        2.1.2 URL去重第16页
        2.1.3 动态网页的爬取第16-17页
        2.1.4 多线程爬取第17-18页
    2.2 正则表达式第18-19页
    2.3 基于WebCollector框架的网络爬虫设计第19-24页
        2.3.1 WebCollector简介第19页
        2.3.2 网络爬虫设计第19-24页
    2.4 本章小结第24-25页
第三章 网页正文提取第25-34页
    3.1 网页结构第26-27页
    3.2 HTML网页解析第27页
    3.3 基于密度的阈值自适应正文抽取算法第27-33页
    3.4 本章小结第33-34页
第四章 基于敏感密度的网页正文敏感度分析第34-46页
    4.1 AC算法第35-37页
    4.2 双数组TRIE树第37-39页
    4.3 基于AC算法的改进多模式匹配算法第39-42页
    4.4 敏感词等级库创建第42-43页
    4.5 网页敏感度分析第43-45页
    4.6 本章小结第45-46页
第五章 系统开发第46-54页
    5.1 系统主体框架第46页
    5.2 系统开发文档第46-47页
    5.3 系统模块设计第47-52页
        5.3.1 数据库管理模块第47-48页
        5.3.2 爬虫模块设计第48-49页
        5.3.3 网页正文提取模块第49-50页
        5.3.4 敏感词检测模块第50页
        5.3.5 敏感度分析模块第50-51页
        5.3.6 数据展示模块第51-52页
    5.4 系统关键技术和创新点第52-53页
    5.5 本章小结第53-54页
第六章 总结与展望第54-55页
参考文献第55-57页
在读硕士研究生期间发表论文第57-58页
致谢第58-59页

论文共59页,点击 下载论文
上一篇:基于局部特征的图像匹配算法研究
下一篇:Storm平台的内存电压阈值调控节能策略