首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

微博大数据文本分析方法及推荐服务

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-16页
   ·课题研究背景第9-10页
   ·课题研究的国内外现状第10-13页
     ·微博第10-11页
     ·大数据处理第11-12页
     ·查询词推荐第12-13页
   ·课题研究的内容及来源第13-14页
   ·论文内容的组织架构第14-16页
第2章 新浪微博话题数据抽取方法及数据预处理第16-22页
   ·新浪微话题数据的抽取方法第16-18页
     ·新浪API的数据获取第16-17页
     ·Html网页的信息抽取第17-18页
   ·数据的预处理第18-20页
     ·转发微博和垃圾微博的处理第18-20页
     ·不同用户以及不同时间段的微博数据预处理第20页
   ·本章小结第20-22页
第3章 新浪微话题的媒体特征分析第22-30页
   ·用户数VS微博数第22页
   ·用户参与度与用户活跃度第22-23页
   ·微话题热度与微话题活跃度第23-25页
   ·微话题的演变趋势第25-27页
   ·基于LDA的语义抽取第27-29页
   ·本章小结第29-30页
第4章 基于Hadoop平台下的微博文本大数据处理第30-43页
   ·Hadoop原理与运行机制第30-32页
     ·HDFS组件第30页
     ·MapReduce组件第30-32页
   ·MapReduce的编程框架第32-33页
   ·Hadoop集群环境的搭建和部署第33-37页
   ·Hadoop平台下中文微博倒排索引的实验第37-40页
     ·倒排索引的基本概念第37-38页
     ·MapReduce下倒排索引的算法实现第38-40页
   ·Hadoop平台下数据处理时间第40-42页
     ·不同节点以及不同数据大小数据处理时间第40-41页
     ·实验结果与分析第41-42页
   ·本章小结第42-43页
第5章 基于新鲜方面的Web查询词推荐服务第43-56页
   ·查询词推荐流程图第43-44页
   ·查询词推荐算法第44-45页
   ·数据集的选取与数据评估方法第45-46页
   ·实验结果分析第46-55页
     ·查询词推荐的结果分析第49-54页
     ·样本集选取的结果分析第54-55页
   ·实验结果讨论第55页
   ·本章小结第55-56页
第6章 总结与展望第56-59页
   ·论文总结第56-57页
   ·进一步的工作第57-59页
致谢第59-60页
参考文献第60-64页
攻读学位期间获得与学位论文相关的科研成果第64页

论文共64页,点击 下载论文
上一篇:RFID中间件及其在五菱微车主减速器数据采集中的应用研究
下一篇:粗糙集理论在知识发现数据预处理中的研究与应用