基于用户评论数据的信息提炼技术研究

致谢	第4-5页
摘要	第5-6页
Abstract	第6-7页
1 绪论	第11-25页
1.1 研究背景及意义	第11-15页
1.1.1 研究背景	第11-13页
1.1.2 研究意义	第13-15页
1.2 国内外研究现状	第15-21页
1.2.1 数据采集研究现状	第15-16页
1.2.2 数据挖掘研究现状	第16-17页
1.2.3 特征提取与情感分析	第17-21页
1.2.3.1 国外研究现状	第17-19页
1.2.3.2 国内研究现状	第19-21页
1.3 论文框架	第21-24页
1.3.1 存在问题	第21页
1.3.2 研究内容	第21-24页
1.4 本章小结	第24-25页
2 基于元素定位的文本数据采集	第25-35页
2.1 网络爬虫原理	第25-26页
2.2 网页元素定位数据采集理论基础	第26-29页
2.2.1 Selenium工具简介	第26-27页
2.2.2 定位特性	第27-28页
2.2.3 Java中配置Selenium	第28-29页
2.3 基于Hibernate框架的数据存储	第29-34页
2.3.1 Hibernate基本原理	第29-31页
2.3.2 Hibernate存储框架算法的实现	第31-32页
2.3.3 最终需求环境配置	第32-34页
2.4 本章小结	第34-35页
3 基于最大概率链分词的特征提取	第35-43页
3.1 分词环境介绍	第35-36页
3.2 最大概率链分词	第36-39页
3.2.1 分词原理	第36-38页
3.2.2 分词步骤	第38页
3.2.3 系统词典补充	第38-39页
3.3 特征提取	第39-42页
3.3.1 词频统计	第39-40页
3.3.2 信息增益	第40页
3.3.3 CHI统计	第40-41页
3.3.4 互信息	第41-42页
3.3.5 特征提取方法选取	第42页
3.4 本章小结	第42-43页
4 基于逐级词性匹配的文本情感量化方法	第43-53页
4.1 文本类数据情感分析方法	第43-45页
4.2 情感分析算法	第45-46页
4.3 改进的词性匹配情感分析	第46-52页
4.3.1 词语情感	第46-48页
4.3.2 短语情感	第48-50页
4.3.2.1 贬义对象	第48-49页
4.3.2.2 程度词语	第49-50页
4.3.2.3 引号与极性词组合	第50页
4.3.3 句子情感	第50-51页
4.3.4 情感语句模型	第51-52页
4.4 本章小结	第52-53页
5 用户评论的数据挖掘系统设计	第53-70页
5.1 系统总体实现框架	第53-54页
5.2 数据采集实现	第54-60页
5.3 数据清洗及预处理	第60-62页
5.3.1 噪声与干扰项的清洗	第60-61页
5.3.2 数据格式预处理	第61-62页
5.4 特征提取实现	第62-64页
5.4.1 特征提取试验规则及结果展示	第62-64页
5.4.2 特征结果试验结果分析	第64页
5.5 情感分析实现	第64-69页
5.5.1 情感分析的前处理	第65-66页
5.5.2 试验结果分析及对比	第66-69页
5.6 本章小结	第69-70页
6 总结与展望	第70-72页
6.1 本文总结	第70-71页
6.2 未来展望	第71-72页
参考文献	第72-76页