首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

面向隐式微博主题挖掘系统的设计与实现

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第11-19页
    1.1 研究背景第11页
    1.2 微博及隐式微博第11-14页
        1.2.1 微博第11-13页
        1.2.2 隐式微博第13-14页
    1.3 微博主题挖掘的研究现状第14-16页
        1.3.1 利用聚类方法挖掘微博主题第14-15页
        1.3.2 利用概率主题模型的方法挖掘微博主题第15-16页
    1.4 隐式微博主题挖掘的主要研究内容及难点第16-17页
        1.4.1 隐式微博主题挖掘的主要研究内容第16页
        1.4.2 隐式微博挖掘的难点第16-17页
    1.5 结构安排第17-18页
    1.6 本章小结第18-19页
第二章 主题模型在微博数据上的应用第19-30页
    2.1 主题模型第19-21页
        2.1.1 主题模型的输入第19-20页
        2.1.2 主题模型中的基本假设第20页
        2.1.3 主题模型的表示第20-21页
        2.1.4 新样本的推断第21页
    2.2 主题模型的参数估计第21-22页
        2.2.1 EM算法第21-22页
        2.2.2 Gibbs采样第22页
    2.3 面向隐式微博的主题模型第22-28页
        2.3.1 概率主题模型的由来第23页
        2.3.2 LDA主题模型第23-24页
        2.3.3 面向微博的派生主题模型第24-27页
        2.3.4 考虑隐式微博的主题模型第27-28页
    2.4 各主题模型在微博文本建模上的方法比较第28-29页
    2.5 本章小结第29-30页
第三章 面向隐式微博主题挖掘系统算法设计第30-39页
    3.1 相关定义第30页
    3.2 隐式微博显式化方式探究第30-32页
    3.3 微博生成模型CGRMB-LDA模型第32-37页
        3.3.1 LDA主题模型中的建模算法第32-33页
        3.3.2 CGRMB-LDA模型微博主题生成过程第33-37页
    3.4 评价指标第37-38页
        3.4.1 人工评价Score第37页
        3.4.2 模型困惑度第37-38页
    3.5 本章小结第38-39页
第四章 系统实现第39-51页
    4.1 系统总框架第39-40页
    4.2 获取微博原始数据第40-44页
        4.2.1 微博开放平台API第40-41页
        4.2.2 OAuth用户身份认证第41页
        4.2.3 微博API数据获取流程第41-44页
    4.3 隐式微博分词第44-46页
        4.3.1 中文文本分词第44-45页
        4.3.2 隐式微博的扩充分词第45-46页
    4.4 隐式微博数据预处理第46-47页
        4.4.1 隐式微博停用词去除第46页
        4.4.2 隐式微博缩写词和网络符号替换第46-47页
        4.4.3 隐式微博情感词扩充第47页
    4.5 使用CGRMB-LDA模型得到微博-主题-词汇概率分布第47-50页
        4.5.1 得到CGRMB-LDA主题模型的输入第47-48页
        4.5.2 得到CGRMB-LDA主题模型的输出第48-49页
        4.5.3 CGRMB-LDA主题模型对新样本中主题的预测第49-50页
    4.6 本章小结第50-51页
第五章 实验与结论第51-60页
    5.1 实验结果第51-55页
        5.1.1 初始化分词和数据预处理第51-52页
        5.1.2 隐式微博数据处理第52页
        5.1.3 CGRMB-LDA模型主题输出第52-55页
    5.2 结果分析第55-57页
    5.3 CGRMB-LDA模型参数调整分析第57-59页
        5.3.1 隐式微博在评论转发层级上扩充参数的影响第57-58页
        5.3.2 隐式微博在时间间隔参数上扩充参数的影响第58-59页
    5.4 本章小结第59-60页
第六章 总结与展望第60-61页
参考文献第61-66页
附录1 攻读硕士学位期间发表的学术论文第66-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:不同电压脉冲射频对CCI大鼠模型下丘脑β-内啡肽的影响
下一篇:银屑病全基因组关联分析中遗传性缺失的量化研究