首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

舆情监控系统中的数据倾向分析研究

摘要第3-4页
Abstract第4-5页
1 绪论第8-16页
    1.1 研究背景及意义第8-9页
    1.2 国内外现状第9-14页
        1.2.1 同领域人群倾向分析研究现状第9-12页
        1.2.2 不同领域人群倾向分析研究现状第12-14页
    1.3 本文研究内容第14页
    1.4 论文章节安排第14-16页
2 数据倾向分类方法第16-24页
    2.1 特征选择技术第16-18页
        2.1.1 词频法、文档频次法第16页
        2.1.2 互信息第16-17页
        2.1.3 信息增益提取与决策树第17-18页
    2.2 文本分类技术第18-22页
        2.2.1 向量空间模型第18页
        2.2.2 支持向量机第18-19页
        2.2.3 朴素贝叶斯算法第19-20页
        2.2.4 邻近算法第20-21页
        2.2.5 单边带分类第21页
        2.2.6 Hownet经典算法第21-22页
    2.3 TF/IDF权值计算技术第22页
    2.4 小结第22-24页
3 优化倾向分析方法第24-34页
    3.1 特征选择技术优化方法第24-26页
        3.1.1 文档频率法改进第24-25页
        3.1.2 信息增益法改进第25-26页
        3.1.3 互信息法改进第26页
    3.2 主观提取技术优化方法第26-33页
        3.2.1 义源词汇衍生法分析观点第27-31页
        3.2.2 构建主题模型识别文本主题第31-33页
    3.3 小结第33-34页
4 基于机器学习理念构建舆情分类模型第34-42页
    4.1 目标需求第34页
    4.2 主观思维差异表现第34-35页
        4.2.1 中文表达复杂性第34页
        4.2.2 .领域人群差异性第34-35页
    4.3 解决方案第35页
    4.4 机器学习和数据挖掘理念第35-36页
    4.5 分类器结合原理第36-38页
        4.5.1 分类器组合方案第37页
        4.5.2 传统分类器融合方法第37-38页
        4.5.3 优化分类器融合理念第38页
    4.6 二分法模型搭建第38-41页
        4.6.1 分类器模型原理第38-39页
        4.6.2 分类器实现过程第39-41页
    4.7 小结第41-42页
5 舆情分析实验第42-58页
    5.1 环境搭建第42页
    5.2 评价指标第42页
    5.3 数据集第42-43页
    5.4 实验步骤第43-44页
    5.5 特征选择优化实验第44-49页
        5.5.1 数据预处理第44-45页
        5.5.2 LDA模型的特征优化效果第45-46页
        5.5.3 weka构建与十字交叉第46-47页
        5.5.4 特征优化效果第47-49页
    5.6 数据倾向分类实验第49-55页
        5.6.1 采用eclipse实现数据二次处理第49-50页
        5.6.2 在Hadoop平台上实验第50-55页
    5.7 小结第55-58页
6 总结与展望第58-60页
    6.1 总结第58页
    6.2 展望第58-60页
致谢第60-62页
参考文献第62-68页
附录第68页

论文共68页,点击 下载论文
上一篇:稀疏表示和自商图像在人脸识别中的应用研究
下一篇:微表情在三维动画角色表演中的研究与应用