首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Hadoop的信息爬取与舆情检测算法研究

摘要第5-6页
ABSTRACT第6页
第一章 绪论第10-14页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11页
    1.3 研究内容及章节安排第11-14页
        1.3.1 研究内容第11-12页
        1.3.2 章节安排第12-14页
第二章 相关技术研究第14-20页
    2.1 数据存储与分析技术第14页
    2.2 Hadoop技术简介第14-17页
        2.2.1 HDFS第15-16页
        2.2.2 Map/Reduce第16-17页
    2.3 网络爬虫原理第17-20页
        2.3.1 网络爬虫系统的工作原理第17页
        2.3.2 网络爬虫系统的基本结构第17-18页
        2.3.3 网络爬虫系统的基本原理第18-20页
第三章 数据爬取方案设计与实现第20-40页
    3.1 分布式网络爬虫的设计需求第20-21页
    3.2 系统布局与结构第21-25页
        3.2.1 系统布局第21-22页
        3.2.2 爬虫基本流程设计第22-24页
        3.2.3 爬虫系统的框架设计第24-25页
    3.3 Map/Reduce并行编程模型第25-26页
    3.4 功能模块的Map/Reduce设计第26-31页
    3.5 存储结构的实现第31-33页
        3.5.1 in库第31-32页
        3.5.2 原始网页doc库第32页
        3.5.3 链出out库第32-33页
        3.5.4 XML库第33页
    3.6 爬虫总体数据结构第33-35页
    3.7 数据爬取性能分析第35-40页
第四章 舆情检测算法研究第40-48页
    4.1 现有舆情检测算法分析第40-43页
        4.1.1 聚类分析算法第40-42页
        4.1.2 网络短文本聚类第42页
        4.1.3 舆情检测特征度量第42-43页
        4.1.4 权重模型第43页
    4.2 现有舆情检测算法缺陷分析第43-44页
    4.3 复杂网络理论第44-45页
        4.3.1 复杂网络概述第44页
        4.3.2 复杂网络表示方式第44-45页
    4.4 时间同步理论第45页
    4.5 舆情检测时间同步需求分析第45-48页
第五章 复杂网络模型舆情检测技术第48-64页
    5.1 复杂网络模型构建第48-50页
        5.1.1 网络模型构建第48页
        5.1.2 网络模型特性第48-50页
    5.2 因特网复杂网络模型时间同步第50-59页
        5.2.1 时间同步机制第50页
        5.2.2 TPSN算法第50-51页
        5.2.3 TPSN算法改进第51-59页
    5.3 因特网复杂网络模型仿真分析第59-64页
        5.3.1 模型搭建第59-60页
        5.3.2 协议实现第60-61页
        5.3.3 仿真结果分析第61-64页
第六章 总结第64-66页
致谢第66-68页
参考文献第68-72页
附录 (攻读硕士期间的学术成果)第72-73页
附件第73-74页

论文共74页,点击 下载论文
上一篇:基于可穿戴式设备的新型人机交互系统
下一篇:鱼眼图像无缝全景拼接技术研究