基于社会化媒体的细粒度观点挖掘
本文创新点 | 第6-7页 |
目录 | 第7-11页 |
摘要 | 第11-13页 |
ABSTRACT | 第13-15页 |
0 引言 | 第16-46页 |
0.1 论文选题背景和意义 | 第16-23页 |
0.1.1 研究背景 | 第16-22页 |
0.1.2 研究意义 | 第22-23页 |
0.2 国内外研究现状 | 第23-41页 |
0.2.1 社会化媒体综述 | 第24-31页 |
0.2.2 观点挖掘研究综述 | 第31-40页 |
0.2.3 现有研究的不足之处 | 第40-41页 |
0.3 本文的研究内容、研究方法与创新 | 第41-45页 |
0.3.1 研究内容 | 第41-43页 |
0.3.2 研究方法 | 第43-44页 |
0.3.3 本文创新之处 | 第44-45页 |
0.4 本章小结 | 第45-46页 |
1 相关理论基础 | 第46-72页 |
1.1 文本预处理 | 第46-49页 |
1.1.1 文本预处理流程 | 第46-47页 |
1.1.2 中文分词技术 | 第47-49页 |
1.1.3 停用词过滤 | 第49页 |
1.2 文本特征抽取 | 第49-55页 |
1.2.1 文本特征抽取方法 | 第49-53页 |
1.2.2 特征词权重的影响因素分析 | 第53-55页 |
1.3 文本表示模型 | 第55-59页 |
1.3.1 布尔模型 | 第55-56页 |
1.3.2 向量空间模型 | 第56-57页 |
1.3.3 基于图的文本表示法 | 第57-58页 |
1.3.4 概率语言模型 | 第58-59页 |
1.4 文本分类 | 第59-64页 |
1.4.1 文本分类算法 | 第59-63页 |
1.4.2 分类性能评价 | 第63-64页 |
1.5 依存句法分析基础 | 第64-71页 |
1.5.1 句法分析理论 | 第64-65页 |
1.5.2 依存语法理论 | 第65-66页 |
1.5.3 依存句法分析算法 | 第66-67页 |
1.5.4 依存句法分析器 | 第67-71页 |
1.6 本章小结 | 第71-72页 |
2 社会化媒体信息过滤 | 第72-88页 |
2.1 社会化媒体垃圾概述 | 第72-75页 |
2.1.1 问题的提出 | 第72-73页 |
2.1.2 社会化媒体垃圾的表现形式 | 第73-75页 |
2.2 社会化媒体垃圾检测方法 | 第75-85页 |
2.2.1 基于规则的垃圾信息初步过滤 | 第76-77页 |
2.2.2 网络超短小垃圾信息识别 | 第77-78页 |
2.2.3 基于半监督学习的虚假信息检测 | 第78-85页 |
2.3 虚假信息识别实验 | 第85-87页 |
2.3.1 实验准备 | 第85页 |
2.3.2 有监督学习方法的实验结果 | 第85页 |
2.3.3 不同特征的实验结果 | 第85-86页 |
2.3.4 半监督学习的实验结果 | 第86-87页 |
2.5 本章小结 | 第87-88页 |
3 基于依存句法的特征-观点对抽取 | 第88-114页 |
3.1 问题描述 | 第89-92页 |
3.1.1 社会化媒体信息内容特点的分析 | 第89-90页 |
3.1.2 问题的提出 | 第90-92页 |
3.2 含有主题特征和观点词的组块获取 | 第92-107页 |
3.2.1 组块的定义 | 第92-104页 |
3.2.2 组块规则的建立 | 第104-106页 |
3.2.3 基于规则的组块算法 | 第106-107页 |
3.3 特征-观点对抽取 | 第107-112页 |
3.3.1 候选特征词与观点词的识别 | 第107-109页 |
3.3.2 特征-观点对的抽取 | 第109-112页 |
3.4 特征-观点对抽取实验 | 第112-113页 |
3.4.1 实验过程 | 第112页 |
3.4.2 结果分析 | 第112-113页 |
3.5 本章小结 | 第113-114页 |
4 观点词倾向性分析 | 第114-135页 |
4.1 WEB情感词典的构建 | 第115-119页 |
4.1.1 Web情感极性词典的构建 | 第116-117页 |
4.1.2 情感强度词典的构建 | 第117-119页 |
4.2 观点词情感极性分析 | 第119-127页 |
4.2.1 情感分类方法的选择 | 第119-124页 |
4.2.2 SO-PMI-IR情感分类步骤 | 第124-125页 |
4.2.3 观点词修饰极性的计算 | 第125-127页 |
4.3 观点词情感分类方法对比实验 | 第127-134页 |
4.3.1 实验准备 | 第127-130页 |
4.3.2 结果分析 | 第130-134页 |
4.4 本章小结 | 第134-135页 |
5 细粒度观点挖掘模型的构建 | 第135-147页 |
5.1 细粒度挖掘模型的总体框架 | 第135-139页 |
5.1.1 模型的体系结构 | 第135-136页 |
5.1.2 细粒度挖掘模型的构建步骤 | 第136-139页 |
5.2 主要功能模块设计 | 第139-143页 |
5.2.1 产品评论的抓取与预处理 | 第139-140页 |
5.2.2 信息过滤 | 第140页 |
5.2.3 特征-观点对的抽取 | 第140-141页 |
5.2.4 用户观点的情感极性值计算 | 第141页 |
5.2.5 用户观点统计分析指标的设计 | 第141-143页 |
5.3 细粒度用户观点挖掘可视化实验 | 第143-146页 |
5.3.1 实验准备 | 第143页 |
5.3.2 结果分析 | 第143-146页 |
5.4 本章小结 | 第146-147页 |
6 总结与展望 | 第147-150页 |
6.1 本文的工作总结 | 第147-148页 |
6.2 下一步的工作展望 | 第148-150页 |
参考文献 | 第150-159页 |
攻读博士期间发表的论文 | 第159-160页 |
致谢 | 第160页 |