首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向微博文本的主题探测与追踪研究

主要创新点第5-11页
摘要第11-13页
Abstract第13-15页
第1章 绪论第16-27页
    1.1. 研究背景与意义第16-18页
        1.1.1. 微博文本特征概述第17页
        1.1.2. 微博文本采样概述第17-18页
        1.1.3. 主题探测与追踪概述第18页
    1.2. 国内外研究现状第18-22页
        1.2.1. 面向微博文本的抽样研究第18-19页
        1.2.2. 面向微博文本的主题抽取研究第19-21页
        1.2.3. 面向微博文本流的主题探测与追踪研究第21-22页
    1.3. 面临的问题第22-23页
    1.4. 研究内容与贡献第23-26页
        1.4.1. 研究环境第23页
        1.4.2. 主要研究内容第23-25页
        1.4.3. 主要贡献第25-26页
    1.5. 文章结构安排第26-27页
第2章 基于时间-频率变换的高质量微博抽取第27-40页
    2.1. 引言第27-28页
    2.2. 新浪微博数据获取与统计分析第28-30页
        2.2.1. 新浪微博简介第28-29页
        2.2.2. 基于微博API的数据获取第29-30页
    2.3. 微博特征分析第30-32页
        2.3.1. 问题定义第30页
        2.3.2. 特征分析第30-31页
        2.3.3. 特征矩阵F第31-32页
    2.4. 高质量微博抽取第32-36页
        2.4.1. K维特征的小波变换第33-34页
        2.4.2. K维特征融合第34-36页
    2.5. 实验与讨论第36-39页
        2.5.1. 数据集与实验设置第36页
        2.5.2. 内容冗余性分析第36-37页
        2.5.3. 主观评估第37-39页
        2.5.4. 运行时间第39页
    2.6. 本章小结第39-40页
第3章 基于频繁项集的微博文本聚类与主题抽取第40-58页
    3.1. 引言第40-41页
    3.2. 频繁模式挖掘概述第41-44页
        3.2.1. 基本概念第41-42页
        3.2.2. Apriori算法第42页
        3.2.3. FP-Growth算法第42-44页
    3.3. 预备知识第44-46页
        3.3.1. 相关概念第44-45页
        3.3.2. STC-TE框架第45-46页
    3.4. 基于频繁项集的短文本聚类与主题抽取第46-50页
        3.4.1. 重要频繁项集挖掘与过滤第46页
        3.4.2. 聚类个数自适应的频繁项集谱聚类SC-CSA第46-49页
        3.4.3. 海量短文本聚类与主题抽取第49-50页
    3.5. 实验与讨论第50-57页
        3.5.1. 数据集与实验设置第50-51页
        3.5.2. 性能评价准则第51-52页
        3.5.3. 频繁项集聚类参数与效果分析第52-55页
        3.5.4. 主题抽取与短文本聚类第55-57页
    3.6. 本章小结第57-58页
第4章 基于高效用模式聚类的主题探测与追踪第58-73页
    4.1. 引言第58-59页
    4.2. 基于高效用模式聚类的主题探测第59-65页
        4.2.1. HUPC框架概述第59-60页
        4.2.2. 高效用模式挖掘第60-62页
        4.2.3. 高效用模式增量式聚类第62-64页
        4.2.4. 主题词抽取第64-65页
    4.3. 实验与讨论第65-71页
        4.3.1. 数据集与实验设置第65-66页
        4.3.2. 评估指标第66-67页
        4.3.3. 整体性能比较第67-69页
        4.3.4. 参数分析第69-70页
        4.3.5. 案例展示第70-71页
    4.4. 本章小结第71-73页
第5章 基于新颖性和衰退性概率的主题探测与追踪第73-99页
    5.1. 引言第73-74页
    5.2. 主题模型概述第74-80页
        5.2.1. Latent Dirichlet Allocation(LDA)第74-78页
        5.2.2. Biterm Topic Model(BTM)第78-80页
    5.3. 预备知识第80-83页
        5.3.1. 高质量微博抽取第80页
        5.3.2. 主题演化状态定义第80-82页
        5.3.3. ETT框架第82-83页
    5.4. 面向微博流的主题探测与追踪第83-88页
        5.4.1. 词汇新颖性与衰退性第83-84页
        5.4.2. 潜在主题生成第84-85页
        5.4.3. 主题新颖性与衰退性第85-86页
        5.4.4. 主题演化追踪第86-88页
    5.5. 实验与讨论第88-98页
        5.5.1. 数据集描述第88页
        5.5.2. 实验设置第88-91页
        5.5.3. 新兴主题探测第91-93页
        5.5.4. 背景主题追踪第93-95页
        5.5.5. 主题模型性能测试第95-96页
        5.5.6. 参数分析第96-97页
        5.5.7. 运行时间分析第97-98页
    5.6. 本章小结第98-99页
第6章 结束语第99-101页
    6.1. 全文工作总结第99-100页
    6.2. 未来工作展望第100-101页
参考文献第101-111页
攻博期间发表的研究成果目录第111-112页
攻博期间参与的项目情况第112-113页
致谢第113页

论文共113页,点击 下载论文
上一篇:金属凝固分子动力学模拟的CPU-GPU异构并行算法研究
下一篇:智能车行车环境视觉感知关键技术研究