首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Hadoop微博分类系统的设计与实现

摘要第2-3页
Abstract第3页
1 绪论第7-11页
    1.1 课题背景及研究目的和意义第7-8页
        1.1.1 课题背景第7页
        1.1.2 选题目的和意义第7-8页
    1.2 国内外研究现状第8页
    1.3 本文研究的主要内容第8-9页
    1.4 文章组织结构第9-11页
2 关键技术分析第11-16页
    2.1 微博文本特点第11-12页
    2.2 网页的抓取第12-14页
    2.3 过滤重复微博第14页
    2.4 过滤广告微博第14-15页
    2.5 本章小结第15-16页
3 系统的需求分析第16-24页
    3.1 系统的需求分析第16页
    3.2 可行性分析第16-17页
        3.2.1 经济方面的可行性第16-17页
        3.2.2 技术方面的可行性第17页
        3.2.3 操作方面的可行性第17页
    3.3 非功能需求分析第17页
    3.4 系统目标第17-22页
        3.4.1 微博数据采集处理第18-19页
        3.4.2 云平台搭建第19-20页
        3.4.3 微博文本分类第20-22页
    3.5 系统用例分析第22-23页
    3.6 本章小结第23-24页
4 系统的总体设计第24-41页
    4.1 系统总体设计第24-27页
    4.2 微博文本预处理设计第27-29页
    4.3 微博文本表示设计第29-30页
    4.4 特征提取设计第30-32页
    4.5 分类器的设计第32-34页
    4.6 分类器的评价设计第34页
    4.7 系统环境搭建设计第34-38页
        4.7.1 系统环境配置第35-36页
        4.7.2 Hadoop配置第36-37页
        4.7.3 SSH配置第37页
        4.7.4 Hadoop集群启动第37页
        4.7.5 Hadoop开发插件第37页
        4.7.6 开发环境搭建第37页
        4.7.7 环境配置检验第37-38页
    4.8 数据库设计第38-40页
    4.9 本章小结第40-41页
5 系统实现第41-50页
    5.1 数据库模块实现第41-42页
        5.1.1 配置数据库第41页
        5.1.2 创建数据库表第41-42页
        5.1.3 访问数据库表第42页
    5.2 分类平台的实现第42-49页
        5.2.1 微博的抓取第42-43页
        5.2.2 预处理过程第43-46页
        5.2.3 分类实验第46-49页
    5.3 本章小结第49-50页
6 系统测试第50-55页
    6.1 测试方案第50页
    6.2 单元模块测试第50-51页
    6.3 性能测试第51-54页
        6.3.1 性能测试环境及内容第51-52页
        6.3.2 性能测试环境以及测试内容第52-53页
        6.3.3 性能测试结果第53-54页
        6.3.4 微博分类平台的性能分析第54页
    6.4 本章小结第54-55页
结论第55-56页
参考文献第56-58页
致谢第58-60页

论文共60页,点击 下载论文
上一篇:Oracle数据库内存故障自动诊断系统的研究与开发
下一篇:一重工程技术公司项目管理系统的设计与实现