摘要 | 第4-5页 |
Abstract | 第5-6页 |
1 绪论 | 第9-14页 |
1.1 研究背景及意义 | 第9页 |
1.2 国内外研究现状 | 第9-12页 |
1.2.1 产品属性提取研究现状 | 第9-11页 |
1.2.2 识别有用在线评论的研究现状 | 第11-12页 |
1.3 本文研究内容与组织结构 | 第12-14页 |
2. 在线评论数据及其预处理方法 | 第14-24页 |
2.1 在线评论数据特点 | 第14-18页 |
2.1.1 在线评论的分布平台特点 | 第14-16页 |
2.1.2 在线评论的数据发布特点 | 第16-17页 |
2.1.3 在线评论本身语言的特点 | 第17页 |
2.1.4 在线评论数据发布的动机 | 第17-18页 |
2.2 在线评论数据分词处理方法 | 第18-21页 |
2.2.1 NLPIR汉语分词系统介绍 | 第18-19页 |
2.2.2 分词功能模块的实现及效果 | 第19-20页 |
2.2.3 分词功能实验 | 第20-21页 |
2.3 建立情感词库 | 第21-23页 |
2.3.1 情感词库的建立方法 | 第22页 |
2.3.2 基础情感词库的建立 | 第22-23页 |
2.3.3 网络情感词库的建立 | 第23页 |
2.3.4 产品情感词库的建立 | 第23页 |
2.4 本章小结 | 第23-24页 |
3. 针对在线评论的产品属性提取方法 | 第24-33页 |
3.1 Bootstrapping机器学习算法 | 第24-25页 |
3.2 关联规则挖掘算法 | 第25-27页 |
3.2.1 Apriori算法介绍 | 第25页 |
3.2.2 FP-Growth算法介绍 | 第25-26页 |
3.2.3 关联规则挖掘算法的选择 | 第26-27页 |
3.3 提取模式、提取词置信度的定义与求解 | 第27-29页 |
3.3.1 提取模式、提取词置信度的定义 | 第27页 |
3.3.2 提取模式、提取词置信度的求解 | 第27-29页 |
3.4 基于自扩展模式的产品属性提取算法流程 | 第29-32页 |
3.4.1 复合提取词的挖掘方法 | 第29-30页 |
3.4.2 提取产品属性算法流程 | 第30-32页 |
3.5 本章小结 | 第32-33页 |
4. 基于SVM模型的在线评论有用性识别方法 | 第33-40页 |
4.1 SVM分类方法的技术概述 | 第33-36页 |
4.1.1 SVM模型基本思想 | 第33-35页 |
4.1.2 LibSVM工具 | 第35-36页 |
4.2 算法中的特征值选择 | 第36-38页 |
4.2.1 评论属性数据中特征值选择 | 第36页 |
4.2.2 评论文本数据中特征值选择 | 第36-38页 |
4.3 识别在线评论有用性算法流程 | 第38-39页 |
4.4 本章小结 | 第39-40页 |
5 实验及分析 | 第40-44页 |
5.1 构建实验数据 | 第40-41页 |
5.2 关于产品属性提取算法的实验结果及分析 | 第41-42页 |
5.3 关于在线评论有用性识别方法的实验结果及分析 | 第42-44页 |
结论 | 第44-46页 |
参考文献 | 第46-50页 |
攻读硕士学位期间发表学术论文情况 | 第50-51页 |
致谢 | 第51-52页 |