| 摘要 | 第5-6页 |
| Abstract | 第6-7页 |
| 第一章 绪论 | 第11-17页 |
| 1.1 研究背景及意义 | 第11-12页 |
| 1.2 国内外研究现状 | 第12-14页 |
| 1.3 论文的研究内容 | 第14-15页 |
| 1.4 论文的组织 | 第15-17页 |
| 第二章 基于Hadoop的餐饮评论数据爬取分析 | 第17-31页 |
| 2.1 引言 | 第17页 |
| 2.2 Hadoop基本介绍 | 第17-22页 |
| 2.2.1 Hadoop分布式文件系统HDFS简介 | 第18-19页 |
| 2.2.2 Hadoop并行化计算Map/Reduce简介 | 第19-20页 |
| 2.2.3 REDIS简介 | 第20-21页 |
| 2.2.4 Hbase简介 | 第21-22页 |
| 2.2.5 Zookeeper简介 | 第22页 |
| 2.3 基于hadoop的餐饮评论数据爬取 | 第22-26页 |
| 2.3.1 分布爬虫原理研究 | 第22-23页 |
| 2.3.2 分布式网络爬虫系统的架构设计 | 第23-24页 |
| 2.3.3 分布爬虫的开发流程 | 第24-26页 |
| 2.4 实验与结果分析 | 第26-29页 |
| 2.4.1 测试环境 | 第26-27页 |
| 2.4.2 搭建系统开发分布式环境 | 第27页 |
| 2.4.3 爬虫框架速度对比 | 第27-28页 |
| 2.4.4 爬取的餐饮评论数据展示 | 第28-29页 |
| 2.5 本章小结 | 第29-31页 |
| 第三章 基于逻辑斯蒂回归的餐饮评论情感分类方法分析 | 第31-47页 |
| 3.1 引言 | 第31页 |
| 3.2 逻辑斯蒂回归分类方法与相关分类算法 | 第31-39页 |
| 3.2.1 朴素贝叶斯分类算法 | 第31-32页 |
| 3.2.2 最大熵分类算法 | 第32-35页 |
| 3.2.3 支持向量机 | 第35-36页 |
| 3.2.4 逻辑斯蒂回归 | 第36-39页 |
| 3.3 餐饮评论情感的特征选择及加权 | 第39-42页 |
| 3.3.1 特征选择 | 第39-40页 |
| 3.3.2 特征加权 | 第40-42页 |
| 3.4 餐饮评论情感的文本预处理 | 第42-43页 |
| 3.4.1 文本预处理 | 第42-43页 |
| 3.4.2 文本的形式化表示 | 第43页 |
| 3.5 实验与结果分析 | 第43-46页 |
| 3.5.1 特征选择 | 第43-45页 |
| 3.5.2 特征优化选择 | 第45-46页 |
| 3.6 本章小结 | 第46-47页 |
| 第四章 基于情感词典、修饰词典与句式结构词典相结合的餐饮评论情感分析 | 第47-63页 |
| 4.1 引言 | 第47-48页 |
| 4.2 情感极性的分析 | 第48-49页 |
| 4.3 修饰词典分析 | 第49-52页 |
| 4.3.1 构建否定词词典 | 第50-51页 |
| 4.3.2 构建副词词典 | 第51页 |
| 4.3.3 构建连词、转折词词典 | 第51-52页 |
| 4.4 句式结构的分析 | 第52-53页 |
| 4.5 融合情感词典、修饰词典与句式结构词典相结合的评论情感分析算法设计 | 第53-58页 |
| 4.5.1 融合情感词典、修饰词典与句式结构词典相结合的算法流程 | 第53-55页 |
| 4.5.2 融合情感词典、修饰词典与句式结构词典相结合的算法 | 第55-57页 |
| 4.5.3 评论情感的数据结构与算法实现的伪代码 | 第57-58页 |
| 4.6 实验结果与分析 | 第58-60页 |
| 4.6.1 餐馆评论的情感程度度量 | 第58-60页 |
| 4.6.2 评论的准度分析 | 第60页 |
| 4.6.3 评论情感的应用 | 第60页 |
| 4.7 本章小结 | 第60-63页 |
| 第五章 结束语 | 第63-65页 |
| 5.1 论文总结 | 第63-64页 |
| 5.2 下一步工作 | 第64-65页 |
| 致谢 | 第65-67页 |
| 参考文献 | 第67-73页 |
| 附录A 攻读硕士学位期间发表论文与申请软件著作权 | 第73页 |