首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Hadoop的分布式中文微博情感分析研究与实现

中文摘要第3-4页
Abstract第4页
第一章 绪论第9-18页
    1.1 研究背景及意义第9-10页
    1.2 应用领域第10-11页
        1.2.1 商业领域第10-11页
        1.2.2 公共领域第11页
    1.3 国内外研究现状第11-14页
        1.3.1 事件发现的研究现状第11-12页
        1.3.2 情感分析的研究现状第12-14页
    1.4 中文微博情感分析面临的问题和挑战第14-15页
        1.4.1 海量数据第14页
        1.4.2 行文复杂和文本的缺失性第14-15页
        1.4.3 中文情感词典的构建尚存问题第15页
    1.5 论文主要内容第15-16页
    1.6 论文组织结构第16-18页
第二章 理论基础和相关技术第18-28页
    2.1 文本特征的选择方法第18-20页
        2.1.1 文档频率第18页
        2.1.2 信息增益第18-19页
        2.1.3 互信息(Mutual Information,MI)第19页
        2.1.4 CHI(chi-squarc statistic,CHI)方法第19-20页
    2.2 文本的分类算法第20-23页
        2.2.1 支持向量机(Support Vector Machine,SVM)第20页
        2.2.2 贝叶斯分类方法第20-22页
        2.2.3 K近邻分类器(K-Nearest Neighbor,KNN)第22-23页
    2.3 Hadoop技术第23-28页
        2.3.1 Hadoop的发展和应用第23-24页
        2.3.2 Hadoop分布式文件系统HDFS第24-25页
        2.3.3 Hadoop分布式计算模型MapReduce第25-28页
第三章 基于Hadoop的微博情感分析系统结构设计第28-36页
    3.1 系统概述第28-29页
        3.1.1 需求分析第28页
        3.1.2 系统功能第28-29页
    3.2 系统整体框架第29-30页
    3.3 系统模块设计第30-32页
        3.3.1 系统模块框架第30-31页
        3.3.2 系统模块功能第31-32页
    3.4 数据库设计第32-34页
    3.5 系统数据流设计第34-35页
    3.6 并行分类器框架设计第35-36页
第四章 基于Hadoop的微博情感分析系统详细设计及实现第36-63页
    4.1 数据采集模块第36-42页
        4.1.1 模块功能第36页
        4.1.2.基于网络爬虫的数据采集设计第36-40页
        4.1.3 基于开放平台API的数据采集设计第40-41页
        4.1.4 基于HDFS数据保存设计和实现第41-42页
    4.2 预处理模块第42-47页
        4.2.1 模块功能概述第42页
        4.2.2 数据清洗功能设计第42-43页
        4.2.3 分词功能设计第43-45页
        4.2.4 效果演示第45-47页
    4.3 情感词典的构建模块第47-52页
        4.3.1 模块功能第47页
        4.3.2 情感词典概述第47-49页
        4.3.3 情感词典设计第49-51页
        4.3.4 效果演示第51-52页
    4.4 特征抽取方法模块第52-55页
        4.4.1 词语+词性特征设计第52页
        4.4.2 多元词性组合特征设计第52-53页
        4.4.3 词频特征设计第53-54页
        4.4.4 特征抽取实现第54页
        4.4.5 效果演示第54-55页
    4.5 主客观分类模块第55-60页
        4.5.1 基于加权投票的组合分类方法设计第55-56页
        4.5.2 基于MapReduce的KNN分类器设计与实现第56-57页
        4.5.3 基于MapReduce的贝叶斯并行分类器的设计与实现第57-59页
        4.5.4 SVM分类器设计第59-60页
        4.5.5 加权投票的组合分类方法实现第60页
    4.6 基于情感词典的情感极性分析模块第60-63页
        4.6.1 模块功能第60-61页
        4.6.2 模块设计第61页
        4.6.3 模块实现第61-63页
第五章 系统测试和分析第63-72页
    5.1 测试环境第63页
    5.2 搭建Hadoop集群第63-68页
    5.3 效果展示第68-70页
    5.4 实验结果和分析第70-72页
第六章 总结与展望第72-74页
    6.1 论文总结第72-73页
    6.2 研究展望第73-74页
参考文献第74-76页
致谢第76页

论文共76页,点击 下载论文
上一篇:数据挖掘技术在电信企业存量经营中的应用
下一篇:基于Android平台的心糖系统设计与实现