首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于评论与转发的微博联合主题挖掘系统的设计与实现

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第11-18页
    1.1 研究背景及意义第11页
    1.2 微博相关介绍第11-13页
        1.2.1 微博第11-12页
        1.2.2 微博结构与主题关系第12-13页
    1.3 微博主题挖掘研究现状第13-14页
        1.3.1 聚类方法挖掘微博主题第13-14页
        1.3.2 概率主题模型挖掘微博主题第14页
    1.4 主题词频与主题挖掘第14-16页
        1.4.1 微博主题挖掘的难点第14-15页
        1.4.2 主题词频在挖掘中的作用第15-16页
    1.5 结构安排第16页
    1.6 本章小结第16-18页
第二章 主题模型在微博数据上的应用第18-28页
    2.1 传统主题模型第18-22页
        2.1.1 主题模型的衍化第18-19页
        2.1.2 主题模型的假设与推断第19页
        2.1.3 主题模型的输入与求解第19-21页
        2.1.4 主题模型的参数估计第21-22页
    2.2 微博主题模型第22-24页
        2.2.1 面向微博的派生主题模型第22-23页
        2.2.2 微博主题模型的算法改进第23-24页
    2.3 Labeled LDA特点分析第24-25页
        2.3.1 Labeled LDA的由来第24-25页
        2.3.2 Labeled LDA的优化思想与改进算法第25页
        2.3.3 Labeled LDA文本分类的不足第25页
    2.4 各种主题模型文本建模比较第25-27页
    2.5 本章小结第27-28页
第三章 基于评论与转发的微博主题联合性算法第28-36页
    3.1 微博的评论组与转发链第28页
    3.2 微博与评论的联合主题定性探索第28-31页
        3.2.1 评论组和转发微博的主题矢量第28-30页
        3.2.2 评论组和转发微博在时间维度上的主题相关性第30-31页
    3.3 联合主题对标签矢量影响的定量分析第31-32页
    3.4 Union Labeled LDA主题模型第32-34页
        3.4.1 Union Labeled LDA混合标签对矢量的改进第32页
        3.4.2 Union Labeled LDA微博生成模型第32-33页
        3.4.3 Union Labeled LDA模型对主题挖掘的求解第33-34页
    3.5 主题模型的评价指标第34-35页
        3.5.1 人工评价Score第34-35页
        3.5.2 模型困惑度第35页
    3.6 本章小结第35-36页
第四章 系统实现第36-49页
    4.1 系统框架与流程第36-37页
    4.2 获取新浪微博原始数据第37-41页
        4.2.1 微博开放平台API第37-38页
        4.2.2 OAuth用户身份认证第38页
        4.2.3 微博API数据获取流程第38-41页
    4.3 微博数据分词第41-43页
        4.3.1 中文文本分词第41-42页
        4.3.2 Label标签的信息扩充第42-43页
    4.4 数据预处理第43-44页
        4.4.1 文档集停用词去除第43页
        4.4.2 微博网络词汇和符号替换第43页
        4.4.3 微博情感词扩充第43-44页
    4.5 Label标签训练阶段第44-45页
        4.5.1 Labeled LDA标签训练第44页
        4.5.2 Union Labeled LDA改进标签训练第44-45页
    4.6 微博文档主题词汇概率分布第45-47页
        4.6.1 Union Labeled LDA模型输入数据第45-46页
        4.6.2 Union Labeled LDA模型输出结果第46-47页
        4.6.3 Union Labeled LDA模型对新样本主题预测第47页
    4.7 本章小结第47-49页
第五章 实验与结论第49-59页
    5.1 实验结果第49-53页
        5.1.1 初始化分词和数据预处理第49-50页
        5.1.2 评论转发数据的主题联合性处理第50-51页
        5.1.3 Union Labeled LDA模型的主题输出第51-53页
    5.2 结果分析第53-54页
    5.3 Union Labeled LDA模型参数调整分析第54-57页
        5.3.1 评论组及转发链的联合主题参数设置第54-55页
        5.3.2 联合主题随时间衰减偏离的参数第55-56页
        5.3.3 联合主题影响文档主题分布的比例第56-57页
    5.4 本章小结第57-59页
第六章 总结与展望第59-60页
参考文献第60-64页
致谢第64-65页
附录1攻读硕士学位期间发表的学术论文第65页

论文共65页,点击 下载论文
上一篇:Notch 1信号通路对人肝癌SMMC 7721细胞中高纯度CD133~+细胞增殖和凋亡的影响
下一篇:ZAG通过AKT信号通路改善胰岛素抵抗脂肪细胞的机制研究