摘要 | 第4-5页 |
abstract | 第5-6页 |
第一章 绪论 | 第10-14页 |
1.1 研究工作的背景与意义 | 第10-11页 |
1.2 文本情感倾向分析方法的国内外研究历史与现状 | 第11-12页 |
1.3 本文的主要贡献与创新 | 第12-13页 |
1.4 本文的主要内容和结构安排 | 第13-14页 |
第二章 相关技术及理论 | 第14-25页 |
2.1 引言 | 第14页 |
2.2 中文文本数据特征提取技术 | 第14-19页 |
2.2.1 汉语分词工具 | 第14页 |
2.2.2 文本切割转换 | 第14-17页 |
2.2.3 TF-IDF模型 | 第17-18页 |
2.2.4 Word2vect模型 | 第18-19页 |
2.3 文本情感倾向分析技术 | 第19-23页 |
2.3.1 基于情感词典的文本情感倾向分析 | 第19-20页 |
2.3.2 基于机器学习的文本情感分析 | 第20-23页 |
2.4 文本情感倾向分析效果评价标准 | 第23-24页 |
2.5 本章小结 | 第24-25页 |
第三章 基于网络用户情感空间的情感倾向分析 | 第25-38页 |
3.1 引言 | 第25页 |
3.2 情感词汇本体库和情感表情库 | 第25-27页 |
3.2.1 情感词汇本体库 | 第25-26页 |
3.2.2 情感表情库 | 第26-27页 |
3.3 用户情感特征相关概念和定义 | 第27-32页 |
3.3.1 隐式情感空间 | 第27-30页 |
3.3.2 显式情感空间 | 第30页 |
3.3.3 用户情感空间 | 第30-31页 |
3.3.4 基本情感特征集合 | 第31页 |
3.3.5 用户情感特征模型 | 第31页 |
3.3.6 通用规则定义 | 第31-32页 |
3.4 网络用户情感特征构建算法设计 | 第32-34页 |
3.5 实验结果和分析 | 第34-37页 |
3.5.1 情感密度分析 | 第34-35页 |
3.5.2 隐式情感特征分析 | 第35页 |
3.5.3 显式情感特征分析 | 第35-37页 |
3.6 本章小结 | 第37-38页 |
第四章 基于词典和机器学习的微博文本情感倾向分析 | 第38-49页 |
4.1 引言 | 第38页 |
4.2 基于词典的中文微博情感分析 | 第38-41页 |
4.2.1 分词工具选择 | 第38页 |
4.2.2 网络情感用语词典和合成词典构建 | 第38-39页 |
4.2.3 基于改进词典的文本情感倾向算法 | 第39-40页 |
4.2.4 基于改进词典的微博文本情感倾向分析实验 | 第40-41页 |
4.3 基于word2vect和SVM的中文微博情感分析 | 第41-46页 |
4.3.1 Word2vect模型训练 | 第41-43页 |
4.3.2 W2V_SVM算法 | 第43-46页 |
4.4 基于W2V_SVM的情感倾向分析实验设计 | 第46页 |
4.4.1 实验环境 | 第46页 |
4.4.2 实验数据和评价标准 | 第46页 |
4.5 实验结果分析对比 | 第46-48页 |
4.6 本章小结 | 第48-49页 |
第五章 基于Spark的分布式情感分析系统设计与实现 | 第49-80页 |
5.1 引言 | 第49页 |
5.2 需求分析 | 第49-52页 |
5.2.1 功能需求 | 第49-50页 |
5.2.2 系统用例 | 第50-51页 |
5.2.3 非功能需求 | 第51-52页 |
5.3 系统设计 | 第52-57页 |
5.3.1 系统架构设计 | 第52-53页 |
5.3.2 缓存系统数据库设计 | 第53-54页 |
5.3.3 结果存储数据库设计 | 第54-57页 |
5.3.4 模型存储设计 | 第57页 |
5.4 系统实现 | 第57-74页 |
5.4.1 数据获取模块 | 第58-64页 |
5.4.2 数据缓存模块 | 第64-67页 |
5.4.3 数据分析模块 | 第67-70页 |
5.4.4 结果存储模块 | 第70-71页 |
5.4.5 可视化模块 | 第71-74页 |
5.5 系统测试 | 第74-79页 |
5.5.1 爬虫模块测试 | 第74-75页 |
5.5.2 缓存模块测试 | 第75-77页 |
5.5.3 数据分析模块测试 | 第77-79页 |
5.5.4 响应时间测试 | 第79页 |
5.6 本章小结 | 第79-80页 |
第六章 总结与展望 | 第80-82页 |
6.1 全文总结 | 第80页 |
6.2 未来展望 | 第80-82页 |
致谢 | 第82-83页 |
参考文献 | 第83-86页 |
在学期间取得的与学位论文相关的研究成果 | 第86页 |