摘要 | 第5-6页 |
ABSTRACT | 第6页 |
第1章 绪论 | 第10-16页 |
1.1 研究背景及意义 | 第10-11页 |
1.2 国内外研究现状 | 第11-12页 |
1.3 本文主要研究内容 | 第12-14页 |
1.4 本文的组织结构 | 第14-16页 |
第2章 商品评论分析相关理论和资源 | 第16-25页 |
2.1 相关概念 | 第16-18页 |
2.1.1 文本情感分析的意义 | 第16页 |
2.1.2 文本情感分析的分类 | 第16-17页 |
2.1.3 主观性文本 | 第17页 |
2.1.4 垃圾评论文本 | 第17页 |
2.1.5 虚假评论文本 | 第17-18页 |
2.2 商品评论情感分析相关技术 | 第18-22页 |
2.2.1 商品评论情感分析流程 | 第18页 |
2.2.2 文本预处理 | 第18-19页 |
2.2.3 监督式机器学习算法概述 | 第19-21页 |
2.2.4 情感分类评测标准 | 第21-22页 |
2.3 实验平台和相关资源 | 第22-24页 |
2.3.1 语料库 | 第22-23页 |
2.3.2 基础情感词典 | 第23页 |
2.3.3 数据挖掘工具 | 第23-24页 |
2.3.4 实验的硬件配置和软件配置 | 第24页 |
2.4 本章小结 | 第24-25页 |
第3章 商品评论中垃圾评论的识别研究 | 第25-31页 |
3.1 基于随机森林和规则匹配的垃圾评论识别 | 第25-28页 |
3.1.1 特征提取 | 第26-27页 |
3.1.2 随机树生成算法 | 第27-28页 |
3.1.3 BRF算法 | 第28页 |
3.2 实验结果分析与评价 | 第28-30页 |
3.2.1 数据集构建 | 第28-29页 |
3.2.2 实验结果与分析 | 第29-30页 |
3.3 本章小结 | 第30-31页 |
第4章 基于分布离群度的虚假评论分析研究 | 第31-43页 |
4.1 虚假商品评论识别介绍 | 第31-32页 |
4.2 特征空间设计 | 第32-38页 |
4.2.1 分布离群度 | 第32-37页 |
4.2.1.1 词性分布离群度 | 第33-35页 |
4.2.1.2 情感分布离群度 | 第35-37页 |
4.2.2 评论长度 | 第37页 |
4.2.3 内容相似度和重复频度 | 第37-38页 |
4.3 基于投票的融合分类器 | 第38-40页 |
4.4 实验结果与分析 | 第40-42页 |
4.4.1 数据集构建 | 第40页 |
4.4.2 基于融合分类器的实验结果 | 第40-41页 |
4.4.3 不同特征的实验结果 | 第41-42页 |
4.4.4 不同的特征权重实验结果 | 第42页 |
4.5 本章小结 | 第42-43页 |
第5章 基于情感词典的商品评论倾向性分析研究 | 第43-49页 |
5.1 情感词典及情感词典构建 | 第43-45页 |
5.1.1 word2vec介绍 | 第43-44页 |
5.1.2 商品评论情感词典的构建 | 第44-45页 |
5.2 评论文本情感倾向性分析过程 | 第45-47页 |
5.2.1 SO-PMI-local算法设计 | 第45-46页 |
5.2.2 改进的SO-PMI-DR算法 | 第46-47页 |
5.3 实验结果与分析 | 第47-48页 |
5.3.1 数据集构建 | 第47页 |
5.3.2 改进算法SO-PMI-DR的实验结果与分析 | 第47-48页 |
5.4 本章小结 | 第48-49页 |
第6章 总结和展望 | 第49-51页 |
6.1 工作总结 | 第49页 |
6.2 未来展望 | 第49-51页 |
参考文献 | 第51-54页 |
附录 A 攻读学位期间所发表的学术论文及参加的项目 | 第54-55页 |
致谢 | 第55页 |