首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于Hadoop的微博热点信息的聚类提取应用研究

摘要第1-4页
Abstract第4-10页
1 引言第10-15页
   ·研究背景和意义第10-12页
   ·国内外研究现状第12-13页
     ·国外研究现状第12页
     ·国内研究现状第12-13页
   ·论文结构第13-14页
   ·本章小结第14-15页
2 相关工作与技术综述第15-21页
   ·微博文本特征表示第15页
   ·分词处理第15页
   ·概率主题模型应用思想及以微博为研究对象的建模应用第15-16页
   ·LDA概率模型思想简介及以微博为研究对象的建模应用第16-17页
   ·文本热点词元提取算法第17-19页
     ·TF-IDF公式原理第18页
     ·微博主题特征词的提取算法第18-19页
   ·相似度计算及聚类算法第19页
   ·本章小结第19-21页
3 微博热点信息聚类提取计算第21-26页
   ·微博发表日期及衰减度计算第21页
   ·基于LDA模型的微博文本内容的相似度计算及聚类分析第21-24页
   ·基于微博用户影响力因素对微博热度值的计算第24页
   ·微博热点话题的关联及推荐第24-25页
   ·本章小结第25-26页
4 Hadoop云计算平台关键技术简介及微博热点信息聚类提取的实现第26-39页
   ·Hadoop云计算平台概念及发展趋势第26-27页
   ·分布式文件系统架构第27-29页
   ·分布式数据处理-MapReduce及实现机制第29-30页
   ·MapReduce编程模型第30-31页
   ·基于Hadoop平台的微博热点信息聚类提取的研究与实现第31-38页
     ·统计每条微博中单词的出现次数第34页
     ·计算微博单词词频TF第34页
     ·计算微博单词的TF-IDF值第34-35页
     ·计算主题特征词的权重第35页
     ·基于概率主题模型LDA的微博文本信息的相似度计算实现第35-37页
     ·基于微博用户影响力计算微博的热度值第37页
     ·热点词元与话题的关联计算第37-38页
   ·本章小结第38-39页
5 实验设计及结果分析第39-46页
   ·云计算平台搭建硬件解决方案第39页
   ·微博实验数据获取第39页
   ·实验设计第39-40页
     ·评价标准第39-40页
     ·分词处理第40页
   ·实验结果第40-44页
     ·基于模型LDA的微博热点信息聚类提取结果评价第40-42页
     ·基于Hadoop云计算平台对算法效率提升的结果评价第42-44页
   ·本章小结第44-46页
6 总结与展望第46-48页
   ·总结第46-47页
   ·展望第47-48页
致谢第48-49页
参考文献第49-51页
作者简介第51页

论文共51页,点击 下载论文
上一篇:牛乳体细胞计数系统的研究与设计
下一篇:双目立体视觉测量系统关键技术的研究与实现