首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向微博社区的图数据挖掘技术研究与实现

【摘要】:近年,微博作为热门的社交网络平台,凭借其信息量大、开放性高和准入门槛低等特点,使得其用户数量和活跃度都保持较快速度的增长。随着用户数量的增大,微博中存在的关联关系变得越来越复杂。用户通过发表博文、参与话题、关注用户等关联方式构成了具有某种特征的社区,其中特征包括有相似兴趣爱好,朋友圈或价值观等。在处理大量关联关系时,使用关系数据库进行数据挖掘的方法已经难以满足实际应用的需求。本文运用图数据挖掘技术和工具对微博用户关联关系进行处理,能够发现用户群体的特征,并能进行用户推荐、事件分析、产品推广和市场营销等。对于微博社区挖掘的问题,本文主要做了以下几方面工作:(1)针对新浪微博中用户关联关系的特点来构建用户关系模型,关系模型中使用用户标签来标识用户特征。然后基于频繁子图挖掘的方法,提出两种随机游走的方式来生成模式图,并通过计算生成模式图的支持度,挖掘关系结构中的频繁模式图,再通过计算关系模式图之间结构相似度来进行聚类,进而发现用户关系中的特征结构。最后通过使用图数据库来处理新浪微博关注关系数据,验证并比较了两种方法的处理效率和效果。(2)针对在新浪微博用户使用的标签数据中存在很多相似标签的特点,本文将相似标签图挖掘算法应用于频繁模式图支持度计算中,提高发现关系结构中特征结构的效果,并通过相应的实验分析,最终给出了相似标签图挖掘和微博关联关系结构发现的评估结果。(3)从新浪微博实际应用需求角度出发,提出了一种构建在图数据库上的微博社区发现服务架构,详细介绍了构架中的各个模块的功能,并简要介绍了在新浪微博中的服务策略。
【关键词】:图数据挖掘 微博关系模型 频繁模式图 相似标签 社区发现 图数据库
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP311.13
论文共68页,点击 下载论文
上一篇:面向人才招聘的搜索引擎优化技术研究
下一篇:面向智能监控的视频分析技术研究