首页--社会科学总论论文--统计学论文--统计方法论文--统计图示法论文

基于LDA主题模型的新浪微博用户兴趣研究

摘要第11-12页
ABSTRACT第12-13页
第1章 绪论第14-24页
    1.1 研究背景第14-15页
    1.2 研究意义第15-16页
    1.3 国内外研究综述第16-21页
        1.3.1 关于主题模型的相关研究第16-18页
        1.3.2 关于新浪微博的相关研究第18-20页
        1.3.3 研究述评第20-21页
    1.4 研究内容及创新第21-22页
        1.4.1 研究内容第21页
        1.4.2 研究创新性第21-22页
    1.5 论文组织结构第22-24页
第2章 模型理论基础第24-34页
    2.1 基本概念第24-27页
        2.1.1 贝叶斯方法第24页
        2.1.2 伽玛函数第24页
        2.1.3 多项分布第24-25页
        2.1.4 贝塔分布第25-26页
        2.1.5 狄利克雷分布第26-27页
    2.2 共轭分布第27-29页
        2.2.1 二项分布和贝塔分布第27-28页
        2.2.2 多项分布和狄利克雷分布第28-29页
    2.3 文本建模第29-34页
        2.3.1 Unigram基础模型第29-30页
        2.3.2 加入贝叶斯框架的Unigram模型第30-31页
        2.3.3 PLSA模型第31-34页
第3章 LDA主题模型的构建第34-44页
    3.1 模型的推导和表示第34-38页
        3.1.1 加入贝叶斯框架第34-35页
        3.1.2 增加参数第35页
        3.1.3 物理过程分解第35-36页
        3.1.4 LDA模型中的共轭分布第36-38页
        3.1.5 概率表达式第38页
    3.2 吉布斯采样第38-41页
        3.2.1 前提条件第38-39页
        3.2.2 特殊的转移概率矩阵第39页
        3.2.3 吉布斯采样具体采样过程第39页
        3.2.4 LDA模型中的采样第39-41页
    3.3 参数估计第41页
    3.4 模型的训练和推断第41-42页
        3.4.1 直接建模训练和推断第41页
        3.4.2 利用训练好的模型推断第41-42页
    3.5 模型的评估第42-44页
        3.5.1 困惑度第42-43页
        3.5.2 连贯度第43-44页
第4章 面向新浪微博的爬虫系统的设计与开发第44-52页
    4.1 网络爬虫的通用模块第44-45页
    4.2 网络爬虫程序的设计和实现第45-51页
        4.2.1 初始URL和待抓取URL队列第45-47页
        4.2.2 微博用户身份认证第47页
        4.2.3 网页源码获取和微博限制访问机制第47-49页
        4.2.4 网页动态加载第49页
        4.2.5 网页解析第49-51页
    4.3 网络爬虫程序功能测试第51-52页
第5章 基于LDA模型的新浪微博用户兴趣偏好挖掘第52-72页
    5.1 实验准备第52-59页
        5.1.1 数据说明第52-56页
        5.1.2 数据收集第56-57页
        5.1.3 文档集的表现形式第57-59页
    5.2 文本预处理第59-61页
        5.2.1 中文分词第59页
        5.2.2 降噪处理第59-61页
    5.3 参数选择和优化第61-63页
        5.3.1 先验分布参数第61页
        5.3.2 主题数目第61-63页
    5.4 主题模型的训练和展示第63-69页
        5.4.1 直接建模训练和推断第63-66页
        5.4.2 利用训练好的模型推断第66-69页
    5.5 实验结果评估第69-72页
        5.5.1 模型质量评估第69-70页
        5.5.2 模型应用评估和分析第70-72页
第6章 总结和展望第72-76页
    6.1 全文总结第72-73页
    6.2 研究展望第73-76页
参考文献第76-80页
致谢第80-81页
学位论文评阅及答辩情况表第81页

论文共81页,点击 下载论文
上一篇:西北城镇回族老年人主观幸福感及其影响因素研究
下一篇:重庆市育龄女性二孩生育意愿及影响因素研究