分布式下二手汽车关注程度的分析与预测

摘要	第4-5页
ABSTRACT	第5页
第一章绪论	第10-16页
1.1 研究背景与意义	第10-13页
1.1.1 研究背景	第10-12页
1.1.2 研究意义	第12-13页
1.2 国内外研究现状	第13-14页
1.2.1 国外大数据挖掘和分析现状	第13页
1.2.2 国内大数据挖掘和分析现状	第13-14页
1.3 本文主要工作及章节安排	第14-15页
1.4 本章小结	第15-16页
第二章网站数据爬取与存储	第16-26页
2.1 引言	第16页
2.2 爬虫相关知识	第16-17页
2.3 爬虫框架Scrapy	第17-22页
2.3.1 Scrapy-Redis分布式网页爬虫框架	第19-20页
2.3.2 Scrapy-Reids集群	第20-22页
2.4 Xpath与正则表达式获取网页内容	第22-25页
2.5 本章小结	第25-26页
第三章数据仓库的建立	第26-34页
3.1 引言	第26-27页
3.2 Hadoop分布式架构与MySQL数据库	第27-30页
3.2.1 MapReduce模型	第27-29页
3.2.2 数据库的选择	第29-30页
3.3 用于数据存储的小型Hadoop集群的搭建	第30-31页
3.4 数据的提取	第31-33页
3.5 本章小结	第33-34页
第四章预处理与分析	第34-41页
4.1 引言	第34页
4.2 二手汽车市场研究	第34-36页
4.3 数据的预处理过程	第36-37页
4.4 网站数据分析-关注人数与特征的关系	第37-40页
4.5 本章小结	第40-41页
第五章建立模型	第41-50页
5.1 引言	第41页
5.2 模型建立	第41-49页
5.2.1 分析方法与过程	第42-44页
5.2.2 建模仿真	第44-49页
5.3 本章小结	第49-50页
总结与展望	第50-52页
总结	第50页
展望	第50-52页
参考文献	第52-56页
攻读学位期间发表的专利	第56-58页
致谢	第58页