基于电商平台的产品评论大数据获取及应用

摘要	第1-4页
ABSTRACT	第4-9页
第1章绪论	第9-17页
·引言	第9页
·产品评论数据的研究背景	第9-10页
·产品评论数据的研究意义	第10-11页
·产品评论数据研究的理论意义	第10-11页
·产品评论数据研究的实际意义	第11页
·产品评论数据处理的国内外研究现状	第11-13页
·产品评论大数据的研究内容及方法	第13-14页
·产品评论大数据的研究内容	第13-14页
·产品评论大数据的研究方法	第14页
·论文的组织结构	第14-16页
·本章小结	第16-17页
第2章产品评论大数据挖掘与处理的相关技术基础	第17-31页
·大数据处理的关键技术	第17-20页
·Hadoop的总体框架	第17-18页
·基于Map Reduce的数据处理过程	第18-19页
·基于HDFS分布式文件系统的存取原理	第19-20页
·产品评论数据抓取的关键技术	第20-23页
·Nutch的系统布局	第20-21页
·Nutch的工作原理	第21-23页
·评论网页数据中评论语句的抽取	第23-25页
·产品评论网页数据的预处理技术	第23-24页
·产品评论语句的清洗	第24页
·产品评论数据获取结果评价	第24-25页
·实验测试分析	第25-30页
·实验平台构建	第25-29页
·实验结果分析	第29-30页
·本章小结	第30-31页
第3章基于MAPREDUCE的产品评论数据聚类	第31-44页
·基于VSM的评论语句相似度计算	第32-35页
·特征词的选择	第32-33页
·评论文本的向量表示	第33页
·特征权重的计算	第33-34页
·评论语句的相似性计算	第34-35页
·聚类算法设计	第35-38页
·K-means算法	第35-37页
·Canopy算法	第37-38页
·基于Map Reduce的聚类算法设计与实现	第38-42页
·基于Map Reduce的Canopy聚类算法实现	第39-40页
·基于Map Reduce的K-means聚类算法实现	第40-42页
·实验设计	第42-43页
·实验环境	第42页
·实验过程	第42-43页
·本章小结	第43-44页
第4章基于产品属性的评论语句观点提取	第44-66页
·评论语句的词法结构分析	第45-48页
·产品评论语句的划分	第45-46页
·评论语句的词性标注	第46-47页
·评论语句的句法结构分析	第47-48页
·属性词识别	第48-54页
·名词短语的标注	第49页
·最大熵原理	第49-51页
·特征集的选取	第51-52页
·最优特征参数和最优模型的求解	第52页
·基于最大熵模型的名词短语识别	第52-53页
·属性无关词过滤	第53-54页
·评价词的极性分析和属性词的观点提取	第54-60页
·极性词典的构建	第54-57页
·评价词的极性分析	第57-59页
·属性词的评价观点提取	第59-60页
·观点的整合	第60-64页
·属性词的相似度计算	第61-62页
·评论摘要的生成	第62-63页
·评价摘要的质量评价	第63-64页
·提取结果评估	第64页
·本章总结	第64-66页
第5章应用测试分析	第66-71页
·XX净水器的评论语句观点分析	第66-68页
·评论语句的应用分析	第68-69页
·评论语句的应用举例	第69页
·本章总结	第69-71页
第6章总结与展望	第71-73页
·本文工作总结	第71-72页
·未来工作展望	第72-73页
致谢	第73-74页
参考文献	第74-80页
攻读硕士学位期间发表的学术论文	第80页