首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

面向社交媒体数据的层次化主题建模--以推特数据为例

摘要第5-6页
Abstract第6-7页
第一章 绪论第10-16页
    1.1 研究背景与意义第10-11页
    1.2 国内外研究现状第11-14页
        1.2.1 基于社交平台的短文本预处理第11页
        1.2.2 基于社交媒体数据的社交关系分析第11-12页
        1.2.3 基于社交媒体数据的话题检测第12-13页
        1.2.4 文本OLAP分析第13-14页
    1.3 本文研究内容第14页
    1.4 本文组织结构第14-16页
第二章 相关理论基础第16-31页
    2.1 文本表示和建模第16-23页
        2.1.1 向量空间模型第16页
        2.1.2 潜在语义分析(LSA)第16-17页
        2.1.3 概率潜在语义分析(PLSA)第17-20页
        2.1.4 隐含狄利克雷分布(LDA)第20-21页
        2.1.5 层次隐含狄利克雷分布(hLDA)第21-23页
    2.2 在线分析处理(OLAP)第23-28页
        2.2.1 OLAP相关概念第23-25页
        2.2.2 典型OLAP操作第25-27页
        2.2.3 多维数据模型第27-28页
    2.3 Word2Vec第28-30页
        2.3.1 词向量第29页
        2.3.2 CBOW模型和Skip-Gram模型第29-30页
    2.4 本章小结第30-31页
第三章 社交短文本数据预处理方法研究第31-48页
    3.1 推特数据定义第31-32页
    3.2 基于短文本聚类分析的单词加权算法第32-39页
        3.2.1 结合语义分析和K-medoids的短文本自适应聚类算法第34-37页
        3.2.2 基于聚类信息的短文本单词加权算法第37-39页
    3.3 基于LDA和加权词图模型的单词评分算法第39-45页
        3.3.1 构建加权词图第39-40页
        3.3.2 改进的单词评分转移机制第40-44页
        3.3.3 单词评分第44-45页
    3.4 结合推文热度属性和单词评分的推文数据清洗方法第45-47页
    3.5 本章小结第47-48页
第四章 支持OLAP分析的社交数据层次化主题建模方法第48-61页
    4.1 推特数据分析第48-50页
    4.2 多维数据模型构建第50-51页
    4.3 基于thLDA模型的社交数据主题维层次自动提取方法第51-60页
        4.3.1 面向推特数据的文本建模第51-53页
        4.3.2 thLDA模型第53-54页
        4.3.3 thLDA推导第54-60页
    4.4 本章小结第60-61页
第五章 实验分析第61-76页
    5.1 数据集和实验环境第61页
    5.2 社交短文本预处理方法评估第61-67页
        5.2.1 基于LDA和加权词图模型的单词评分算法实验评估第63-64页
        5.2.2 基于短文本聚类分析的单词加权算法实验评估第64-65页
        5.2.3 结合热度属性和单词评分的推文数据清洗方法实验评估第65-67页
    5.3 thLDA模型评估第67-73页
        5.3.1 PMI-Score指标评估第67-69页
        5.3.2 困惑度指标评价第69-70页
        5.3.3 thLDA主题建模结果展示第70-73页
    5.4 OLAP分析效果第73-75页
    5.5 本章小结第75-76页
第六章 总结与展望第76-78页
    6.1 本文工作总结第76-77页
    6.2 未来展望第77-78页
致谢第78-80页
参考文献第80-85页
附录第85-86页
详细摘要第86-88页

论文共88页,点击 下载论文
上一篇:3D打印机的运动结构分析
下一篇:基于社交网络的组织成员识别及其兴趣爱好挖掘方法研究