摘要 | 第4-5页 |
abstract | 第5-6页 |
1 绪论 | 第10-18页 |
1.1 研究背景和意义 | 第10-13页 |
1.1.1 研究背景 | 第10-11页 |
1.1.2 研究意义 | 第11-13页 |
1.2 国内外研究现状 | 第13-15页 |
1.2.1 电子商务用户满意度影响因素研究现状 | 第13页 |
1.2.2 网络文本评论挖掘现状 | 第13-15页 |
1.3 研究内容及论文创新点 | 第15-16页 |
1.3.1 研究内容 | 第15-16页 |
1.3.2 论文创新点 | 第16页 |
1.4 研究框架 | 第16-18页 |
2 相关理论与关键技术 | 第18-28页 |
2.1 用户满意度概述 | 第18-19页 |
2.2 文本聚类概述 | 第19-21页 |
2.2.1 文本聚类算法类型 | 第19-20页 |
2.2.2 文本聚类算法应用 | 第20-21页 |
2.3 网络数据采集 | 第21-28页 |
2.3.1 网络爬虫概念及原理 | 第21-23页 |
2.3.2 Scrapy框架抓取数据流程 | 第23-26页 |
2.3.3 网络爬虫反爬机制 | 第26-27页 |
2.3.4 正则表达式 | 第27-28页 |
3 华为京东自营官方旗舰店mate9手机评论数据采集与处理 | 第28-40页 |
3.1 华为京东自营官方旗舰店简介 | 第28-29页 |
3.2 京东商城评论文本数据抓取 | 第29-36页 |
3.2.1 爬取对象介绍 | 第29-30页 |
3.2.2 Scrapy框架抓取数据的具体流程 | 第30-36页 |
3.3 中文分词 | 第36-39页 |
3.3.1 中文分词工具介绍 | 第36-37页 |
3.3.2 停用词词典建立 | 第37-38页 |
3.3.3 评论文本分词处理 | 第38-39页 |
3.4 本章小结 | 第39-40页 |
4 华为京东自营官方旗舰店mate9手机用户满意度影响因素 | 第40-56页 |
4.1 抽取关键特征词 | 第40-42页 |
4.1.1 分词词性标注 | 第40-41页 |
4.1.2 分词词频统计 | 第41-42页 |
4.2 特征词聚类分析 | 第42-51页 |
4.2.1 向量空间模型VSM(vectorspacemodel) | 第42-43页 |
4.2.2 TF-IDF算法特征词权值计算 | 第43-45页 |
4.2.3 合并同义词 | 第45-46页 |
4.2.4 K-Means算法特征词聚类 | 第46-51页 |
4.3 用户满意度影响因素样本得分 | 第51-55页 |
4.3.1 情感词的提取及情感词词典建立 | 第51-52页 |
4.3.2 程度副词词典建立 | 第52-53页 |
4.3.3 否定词词典建立 | 第53-54页 |
4.3.4 词典词语定位及匹配赋值 | 第54-55页 |
4.4 本章小结 | 第55-56页 |
5 研究结论 | 第56-63页 |
5.1 研究结论 | 第56-57页 |
5.2 对京东商城以及华为手机供应商的建议 | 第57-61页 |
5.2.1 京东商城以及华为手机供应商建议模型 | 第57页 |
5.2.2 对京东商城物流的建议 | 第57-59页 |
5.2.3 对京东商城服务的建议 | 第59-60页 |
5.2.4 对华为手机供应商产品的建议 | 第60-61页 |
5.3 研究不足与展望 | 第61-62页 |
5.4 本章总结 | 第62-63页 |
附录 | 第63-69页 |
参考文献 | 第69-73页 |
致谢 | 第73-74页 |