首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

网络舆情评论文本信息的R挖掘研究--以“徐玉玉”电信诈骗事件为例

摘要第3-4页
Abstract第4-5页
第1章 绪论第8-15页
    1.1 研究背景和意义第8-9页
    1.2 文本数据挖掘的研究现状第9-12页
        1.2.1 网络舆情信息分析系统第9-10页
        1.2.2 中文分词第10-11页
        1.2.3 机器学习分类方法第11-12页
    1.3 R语言运用于文挖掘的分析第12-14页
    1.4 本文的研究内容及组织结构第14-15页
第2章 文本数据收集与中文分词第15-24页
    2.1 数据收集与预处理第15-16页
        2.1.1 数据收集第15-16页
        2.1.2 解析用户名、微博内容信息及时间第16页
    2.2 中文分词与词频统计第16-21页
        2.2.1 中文分词第16-17页
        2.2.2 创建语料库第17-19页
        2.2.3 创建文档—词条矩阵第19-21页
    2.3 统计词频与数据可视化第21-24页
第3章 热度分析与回归分析第24-39页
    3.1 热度分析第24-25页
    3.2 回归分析第25-39页
        3.2.1 获取点赞数量第25-26页
        3.2.2 多元线性回归第26-31页
        3.2.3 决策树回归第31-32页
        3.2.4 随机森林第32-39页
第4章 聚类分析与文档分类分析第39-54页
    4.1 聚类分析与主题评判第39-44页
        4.1.1 距离定义第39-40页
        4.1.2 聚类分析第40-42页
        4.1.3 主题判别第42-44页
    4.2 有监督的学习技术第44-48页
        4.2.1 朴素贝叶斯分类器第44-45页
        4.2.2 支持向量机SVM第45-46页
        4.2.3 随机森林第46页
        4.2.4 最大熵第46-48页
    4.3 模型比较第48-50页
    4.4 文档分类第50-51页
    4.5 结果分析与相关建议第51-54页
总结与展望第54-55页
参考文献第55-57页
攻读学位期间发表的学术论文和研究成果第57-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:九种常用缺失值插补方法的比较
下一篇:带时滞的肿瘤模型的稳定性及Hopf分岔分析