摘要 | 第4-5页 |
Abstract | 第5-6页 |
目录 | 第7-9页 |
第1章 绪论 | 第9-17页 |
1.1 研究背景、目的和意义 | 第9-11页 |
1.1.1 研究来源 | 第9-10页 |
1.1.2 研究的背景和意义 | 第10-11页 |
1.2 国内外研究现状及分析 | 第11-14页 |
1.2.1 微博研究现状及分析 | 第11-12页 |
1.2.2 微博对现实世界影响的研究现状及分析 | 第12-13页 |
1.2.3 微博文本挖掘与情感分析研究现状及分析 | 第13-14页 |
1.2.4 移动应用市场研究现状及分析 | 第14页 |
1.3 研究内容与方案 | 第14-17页 |
第2章 相关理论和方法的选择及改进 | 第17-49页 |
2.1 微博文本预处理的方法及改进 | 第17-24页 |
2.1.1 屏蔽新闻和推广信息方法的改进 | 第17-19页 |
2.1.2 分词及词性标注方法 | 第19-20页 |
2.1.3 停用词过滤方法 | 第20-21页 |
2.1.4 主观性计算方法 | 第21-24页 |
2.2 情感分析概述及方法选择 | 第24-39页 |
2.2.1 文本情感分析的主要步骤和工作 | 第24-26页 |
2.2.2 基于聚类/分类技术的文本情感分析方法及改进 | 第26-32页 |
2.2.3 基于情感词典的文本情感分析的方法及改进 | 第32-39页 |
2.3 微博影响力的计算方法及改进 | 第39-45页 |
2.3.1 现有微博影响力计算方法 | 第39-41页 |
2.3.2 简便式微博影响力计算方法 | 第41-45页 |
2.4 预测模型概述及选择 | 第45-48页 |
2.5 本章小结 | 第48-49页 |
第3章 微博及下载量数据的获取和处理 | 第49-62页 |
3.1 数据来源 | 第49-50页 |
3.2 移动应用下载量数据的获取与处理 | 第50-54页 |
3.3 微博数据的抓取与文本数据预处理 | 第54-57页 |
3.3.1 关键字取舍 | 第54-55页 |
3.3.2 文本数据抓取 | 第55-56页 |
3.3.3 文本预处理 | 第56-57页 |
3.4 统计量特征的获取和处理 | 第57-59页 |
3.5 情感特征的获取和特征权重计算 | 第59-60页 |
3.6 影响力特征的获取和处理 | 第60-61页 |
3.7 本章小结 | 第61-62页 |
第4章 微博特征的影响及下载量的预测 | 第62-71页 |
4.1 微博特征对移动应用下载量的影响及分析 | 第62-68页 |
4.1.1 获取研究样本 | 第62-63页 |
4.1.2 微博情感特征对移动应用下载量的影响及分析 | 第63-65页 |
4.1.3 影响力特征对移动应用下载量的影响及分析 | 第65-67页 |
4.1.4 微博统计量特征对移动应用下载量的影响及分析 | 第67-68页 |
4.2 利用回归模型预测移动应用下载量 | 第68-70页 |
4.3 本章小结 | 第70-71页 |
结论 | 第71-73页 |
参考文献 | 第73-78页 |
附录 | 第78-85页 |
附录1 特征值权重算法 | 第78-81页 |
附录2 网页爬取和解析算法 | 第81-83页 |
附表1 褒贬义基准词集 | 第83-85页 |
致谢 | 第85页 |