首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

社交媒体数据上的时态关键词查询

摘要第6-8页
ABSTRACT第8-10页
第一章 绪论第18-26页
    1.1 研究背景第18-20页
    1.2 研究面临的挑战第20-22页
    1.3 主要贡献第22-24页
    1.4 章节安排第24-26页
第二章 问题定义与研究现状第26-44页
    2.1 问题定义第26-31页
        2.1.1 社交媒体数据流模型第26-29页
        2.1.2 时态关键词查询第29-31页
    2.2 社交媒体上的关键字查询第31-33页
    2.3 网页归档数据上的时态关键词查询第33-36页
        2.3.1 布尔语义下的时态关键词查询第33-35页
        2.3.2 top-k时态关键词查询第35-36页
    2.4 时间序列数据上的top-k查询第36-38页
        2.4.1 时间序列的近似第36-37页
        2.4.2 top-k查询第37-38页
    2.5 空间索引第38-40页
        2.5.1 区间数据索引第38页
        2.5.2 社交媒体数据上的时空查询第38-39页
        2.5.3 八叉树结构第39-40页
    2.6 基于社交媒体中时间序列数据的分析应用第40-41页
    2.7 本章小结第41-44页
第三章 基于社交媒体数据特点的双层倒排索引第44-64页
    3.1 引言第44-46页
    3.2 与关键词查询的查询处理第46-51页
        3.2.1 查询处理框架第46页
        3.2.2 近似段数据管理第46-47页
        3.2.3 查询算法第47-49页
        3.2.4 基于长尾分布的算法复杂度分析第49-51页
    3.3 双层倒排索引结构第51-55页
        3.3.1 社交对象的分区第51页
        3.3.2 第一层倒排列表结构第51-53页
        3.3.3 第二层倒排索引结构第53页
        3.3.4 双层倒排列表中的访问第53-55页
    3.4 分段最大近似摘要第55-56页
    3.5 实验分析第56-63页
        3.5.1 实验设置第56-59页
        3.5.2 不同k值下的查询性能第59-61页
        3.5.3 不同查询时间窗口宽度下的性能第61-62页
        3.5.4 不同查询窗口偏移下的性能第62-63页
    3.6 本章小结第63-64页
第四章 社交媒体数据的实时时态关键词查询第64-90页
    4.1 引言第64页
    4.2 时态阈值算法第64-69页
        4.2.1 时态倒排索引第65-66页
        4.2.2 时态阈值算法第66-69页
    4.3 日志结构八叉树索引第69-75页
        4.3.1 日志结构索引第69-70页
        4.3.2 内存八叉树结构第70-72页
        4.3.3 磁盘八叉树结构第72-74页
        4.3.4 磁盘八叉树的合并第74-75页
    4.4 索引遍历算法第75-82页
        4.4.1 索引跳转函数第76-77页
        4.4.2 符合查询条件的节点编码的枚举算法第77-81页
        4.4.3 并发控制第81-82页
    4.5 实验分析第82-89页
        4.5.1 实验设置第82页
        4.5.2 索引段大小阈值τ的影响第82-84页
        4.5.3 不同查询设置下的实验结果第84-86页
        4.5.4 可扩展性实验第86-87页
        4.5.5 索引的并发访问性能第87-89页
    4.6 本章小结第89-90页
第五章 基于时态关键词查询的微博走势分析第90-110页
    5.1 引言第90-91页
    5.2 数据集介绍第91-92页
    5.3 信息传播度量第92-94页
        5.3.1 单条微博流行度度量建模第92-93页
        5.3.2 微博集合的流行度分布建模第93-94页
    5.4 信息传播度量值的拟合与预测第94-98页
        5.4.1 方差分析第95-96页
        5.4.2 趋势建模与预测第96-98页
    5.5 特征定义及其趋势第98-104页
        5.5.1 特征抽取第98-99页
        5.5.2 时序数据的生成第99-101页
        5.5.3 特征趋势分析第101-104页
    5.6 特征与信息传播度量间关联第104-108页
        5.6.1 时序分析技术第104-105页
        5.6.2 内部特征与信息度量之间的关系第105-106页
        5.6.3 特征间关系第106-108页
    5.7 本章小结第108-110页
第六章 MicroblogExplorer演示系统第110-120页
    6.1 系统架构第110-111页
    6.2 数据获取与分析第111-115页
        6.2.1 微博获取第112-113页
        6.2.2 转发爬取第113-114页
        6.2.3 数据处理与分析第114-115页
    6.3 查询结果聚类第115-116页
    6.4 原型系统演示第116-119页
        6.4.1 时态关键词查询第116-117页
        6.4.2 查询结果分析第117-119页
    6.5 本章小结第119-120页
第七章 总结与展望第120-124页
    7.1 本文工作总结第120-121页
    7.2 未来工作展望第121-124页
参考文献第124-132页
致谢第132-134页
攻读博士学位期间发表论文和科研情况第134-135页

论文共135页,点击 下载论文
上一篇:基于DEA和StoNED的两阶段网络结构效率分析研究
下一篇:柏拉图《蒂迈欧》的科学叙事