首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

短文本流数据过滤技术研究及应用

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第10-15页
    1.1 引言第10-11页
    1.2 国内外研究现状第11-13页
    1.3 论文主要工作及研究成果第13-14页
    1.4 论文结构安排第14-15页
第二章 短文本流数据过滤相关理论和技术第15-32页
    2.1 流处理框架第15-23页
        2.1.1 Hadoop框架体系第15-18页
        2.1.2 Puma流处理系统第18-20页
        2.1.3 Storm流处理系统第20-22页
        2.1.4 S4流处理系统第22页
        2.1.5 Spark Streaming第22-23页
    2.2 框架共用技术总结详述第23-30页
        2.2.1 集群管理与一致性控制技术第23-24页
        2.2.2 消息中间件第24-26页
        2.2.3 数据交换的格式第26-30页
    2.3 流处理的存储系统第30页
    2.4 短文本流数据过滤常见问题技术详述第30-32页
第三章 短文本流数据过滤系统第32-46页
    3.1 系统总体架构设计第33-34页
    3.2 系统细分架构设计第34-38页
        3.2.1 设计数据共享机制第34-35页
        3.2.2 设计系统存储方式第35页
        3.2.3 过滤数据信息可视化展示第35-36页
        3.2.4 设计负载均衡第36-37页
        3.2.5 设计并行处理第37页
        3.2.6 设计数据冗余与数据安全第37页
        3.2.7 设计系统自我监控机制第37-38页
    3.3 系统功能概述第38-41页
        3.3.1 系统总体功能第38-40页
        3.3.2 后台功能详述第40-41页
    3.4 系统模块设计说明第41-43页
    3.5 系统数据库表设计第43-46页
        3.5.1 SPAM_KEYWORDS表设计第43-44页
        3.5.2 SPAM_HIGH表设计第44页
        3.5.3 SPAM LOW表设计第44页
        3.5.4 FILTRATE_CONFIG表设计第44-45页
        3.5.5 CLUSTERING_CONFIG表设计第45-46页
第四章 针对文本流的字符串逻辑表达式匹配算法第46-54页
    4.1 问题分析第46-48页
    4.2 算法介绍第48-52页
        4.2.1 生成布尔树第48-50页
        4.2.2 改进的Wu Manber预处理第50-51页
        4.2.3 匹配过程第51-52页
    4.3 复杂度分析第52-54页
        4.3.1 空间复杂度第52页
        4.3.2 时间复杂度第52-54页
第五章 任意时间粒度数据特征分析算法框架第54-61页
    5.1 问题分析第54-55页
    5.2 算法介绍第55-60页
        5.2.1 Router模块第56-57页
        5.2.2 Worker算子模块第57-60页
        5.2.3 Storage模块第60页
    5.3 本章小结第60-61页
第六章 实验及性能测试第61-68页
    6.1 实例系统整体性能第61-64页
    6.2 MSLE算法性能第64-65页
    6.3 任意时间粒度数据特征分析算法框架性能第65-68页
第七章 论文总结与展望第68-70页
    7.1 论文总结第68页
    7.2 展望第68-70页
参考文献第70-73页
致谢第73-74页
攻读硕士学位期间发表论文第74页

论文共74页,点击 下载论文
上一篇:Wi-Fi蜂窝网络中路由构造算法的研究
下一篇:基于IP网络的通用数据采集系统的设计与实现