微博大数据文本分析方法及推荐服务

摘要	第1-5页
Abstract	第5-9页
第1章绪论	第9-16页
·课题研究背景	第9-10页
·课题研究的国内外现状	第10-13页
·微博	第10-11页
·大数据处理	第11-12页
·查询词推荐	第12-13页
·课题研究的内容及来源	第13-14页
·论文内容的组织架构	第14-16页
第2章新浪微博话题数据抽取方法及数据预处理	第16-22页
·新浪微话题数据的抽取方法	第16-18页
·新浪API的数据获取	第16-17页
·Html网页的信息抽取	第17-18页
·数据的预处理	第18-20页
·转发微博和垃圾微博的处理	第18-20页
·不同用户以及不同时间段的微博数据预处理	第20页
·本章小结	第20-22页
第3章新浪微话题的媒体特征分析	第22-30页
·用户数VS微博数	第22页
·用户参与度与用户活跃度	第22-23页
·微话题热度与微话题活跃度	第23-25页
·微话题的演变趋势	第25-27页
·基于LDA的语义抽取	第27-29页
·本章小结	第29-30页
第4章基于Hadoop平台下的微博文本大数据处理	第30-43页
·Hadoop原理与运行机制	第30-32页
·HDFS组件	第30页
·MapReduce组件	第30-32页
·MapReduce的编程框架	第32-33页
·Hadoop集群环境的搭建和部署	第33-37页
·Hadoop平台下中文微博倒排索引的实验	第37-40页
·倒排索引的基本概念	第37-38页
·MapReduce下倒排索引的算法实现	第38-40页
·Hadoop平台下数据处理时间	第40-42页
·不同节点以及不同数据大小数据处理时间	第40-41页
·实验结果与分析	第41-42页
·本章小结	第42-43页
第5章基于新鲜方面的Web查询词推荐服务	第43-56页
·查询词推荐流程图	第43-44页
·查询词推荐算法	第44-45页
·数据集的选取与数据评估方法	第45-46页
·实验结果分析	第46-55页
·查询词推荐的结果分析	第49-54页
·样本集选取的结果分析	第54-55页
·实验结果讨论	第55页
·本章小结	第55-56页
第6章总结与展望	第56-59页
·论文总结	第56-57页
·进一步的工作	第57-59页
致谢	第59-60页
参考文献	第60-64页
攻读学位期间获得与学位论文相关的科研成果	第64页