首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

网络舆情分析系统中辅助搜集功能模块设计与实现

摘要第4-5页
ABSTRACT第5页
第一章 绪论第8-14页
    1.1 背景介绍第8-9页
    1.2 网络舆情的特点第9-10页
        1.2.1 网络舆情的突发性第9页
        1.2.2 网络舆情的强大的聚合力第9页
        1.2.3 网络评论的便捷性第9-10页
        1.2.4 网络舆情的不稳定性和多变性第10页
    1.3 研究现状第10-12页
        1.3.1 国内外研究现状第10-11页
        1.3.2 目前舆情监测系统存在的不足第11-12页
    1.4 研究目的和研究内容第12-14页
        1.4.1 研究目的第12页
        1.4.2 研究内容第12页
        1.4.3 文章组织架构第12-14页
第二章 辅助搜集功能模块需求分析第14-18页
    2.1 需求背景第14-15页
    2.2 需求分析第15-16页
        2.2.1 实现目标第15页
        2.2.2 采集系统的实现功能第15-16页
    2.3 网络舆情检索和预警功能第16-17页
    2.4 本章小结第17-18页
第三章 辅助搜集功能模块的系统架构设计第18-31页
    3.1 网络舆情信息来源第18-19页
        3.1.1 微博空间第18-19页
        3.1.2 网络新闻第19页
        3.1.3 网络社区第19页
    3.2 系统架构设计第19-21页
        3.2.1 分布式架构爬虫设计第20页
        3.2.2 网络舆情采集流程第20-21页
    3.3 详细设计第21-25页
        3.3.1 网页抓取控制器第21-23页
        3.3.2 链接管理队列第23-24页
        3.3.3 HTML分析器第24-25页
    3.4 基于标点连续性的网页正文抽取算法第25-26页
    3.5 数据库详细设计第26-30页
        3.5.1 Hbase数据库简介第27-28页
        3.5.2 Hbase数据库特点第28页
        3.5.3 Hbase-HA高可用部署第28-29页
        3.5.4 数据库表设计第29-30页
    3.6 本章小结第30-31页
第四章 关键技术介绍及系统关键功能实现第31-45页
    4.1 获取网页技术第31-34页
        4.1.1 统一资源定位符第31页
        4.1.2 HTTP协议第31-32页
        4.1.3 HTML标记文本第32页
        4.1.4 URL排重第32-33页
        4.1.5 爬虫爬行搜索策略第33-34页
    4.2 网络舆情数据采集技术第34-36页
        4.2.1 分布式任务调度策略第34-35页
        4.2.2 网页排重技术第35-36页
    4.3 Web抽取技术第36-38页
        4.3.1 自动抽取网页正文技术第36-37页
        4.3.2 自动抽取网页数据技术第37-38页
    4.4 系统关键功能实现第38-44页
        4.4.1 网页正文自动提取第38-42页
        4.4.2 网页数据记录自动提取第42-43页
        4.4.3 网页解析模块第43-44页
    4.5 本章小结第44-45页
第五章 网络舆情数据采集系统实现与实验结果第45-55页
    5.1第45-46页
        5.1.1 运行环境第45页
        5.1.2 站点界面第45-46页
    5.2 爬虫测试结果第46-48页
        5.2.1 单机爬虫测试第46-47页
        5.2.2 分布式爬虫测试第47-48页
    5.3 Web页面抽取测试结果第48-49页
        5.3.1 提取正文信息算法测试结果第48-49页
        5.3.2 网页数据记录提取算法测试的结果第49页
    5.4 网络舆情监控云平台的实现第49-54页
        5.4.1 今日舆情第49-50页
        5.4.2 舆情媒体类型第50页
        5.4.3 舆情来源网站第50-51页
        5.4.4 昨日舆情和新增分布图表第51页
        5.4.5 本地舆情和最新舆情第51-52页
        5.4.6 微博舆情第52-53页
        5.4.7 预警舆情第53页
        5.4.8 舆情走势第53-54页
    5.5 本章小结第54-55页
第六章 总结与展望第55-56页
    6.1 总结第55页
    6.2 展望第55-56页
参考文献第56-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:翻转课堂在高中思想政治课教学中的应用研究
下一篇:面向外存模型的并行层次细节模型技术研究