首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--软件工程论文

数据管理平台—内容识别模块的设计与实现

致谢第5-6页
摘要第6-7页
ABSTRACT第7页
目录第8-11页
1 引言第11-15页
    1.1 项目背景第11页
    1.2 项目目的及意义第11-12页
    1.3 国内外现状第12-13页
    1.4 论文的主要工作第13页
    1.5 论文的组织结构第13-14页
    1.6 本章小结第14-15页
2 项目技术介绍第15-27页
    2.1 Hive第15-16页
    2.2 Hadoop第16-21页
        2.2.1 MapReduce第17-19页
        2.2.2 HDFS第19-21页
    2.3 Scrapy第21-23页
    2.4 设计模式第23-24页
        2.4.1 适配器模块第23页
        2.4.2 单例模式第23-24页
    2.5 反射第24-25页
    2.6 则表达式第25-26页
    2.7 本章小结第26-27页
3 需求分析及总体设计第27-39页
    3.1 系统功能介绍第27-29页
    3.2 系统总体结构介绍第29页
    3.3 系统总体架构介绍第29-30页
    3.4 系统总体流程介绍第30-31页
    3.5 系统数据流图第31-33页
    3.6 系统用例图第33-34页
    3.7 系统规则库结构第34-37页
    3.8 本章小结第37-39页
4 内容识别系统详细设计与实现第39-71页
    4.1 内容识别模块第39-62页
        4.1.1 项目包结构第39-41页
        4.1.2 项目类关系图第41-42页
        4.1.3 基础识别第42-44页
        4.1.4 应用识别第44-45页
        4.1.5 商品识别第45-47页
        4.1.6 搜索关键字识别第47-49页
        4.1.7 Token识别第49-51页
        4.1.8 UA识别第51-54页
        4.1.9 终端识别第54-56页
        4.1.10 站点识别第56-57页
        4.1.11 URL识别第57-60页
        4.1.12 黑名单过滤第60-62页
    4.2 加密导出模块第62-64页
        4.2.1 加密导出模块类设计第62页
        4.2.2 加密导出模块功能设计第62-64页
    4.3 工具类第64-67页
        4.3.1 DBUtil类第65-67页
    4.4 移动端应用抓包第67-68页
    4.5 爬虫设计第68-69页
    4.6 本章小结第69-71页
5 测试第71-75页
    5.1 数据源切换测试第71-72页
    5.2 内容识别测试第72-73页
    5.3 黑名单过滤测试第73页
    5.4 规则库加密导出测试第73-74页
    5.5 本章小结第74-75页
6 结论第75-77页
附录A第77-79页
参考文献第79-81页
作者简历及攻读硕士学位期间取得的研究成果第81-85页
学位论文数据集第85页

论文共85页,点击 下载论文
上一篇:软件公司基于QFD的ERP实施优化研究
下一篇:复杂条件下新型石英压电传感器振动数值模拟及模式识别系统研究