首页--社会科学总论论文--社会学论文--社会生活与社会问题论文--文教、卫生论文

基于LDA模型和信息熵的热门微博发现

内容摘要第5-6页
Abstract第6页
第1章 导论第9-12页
    1.1 研究背景与意义第9-10页
    1.2 文章研究框架、内容以及创新点第10-12页
        1.2.1 研究框架第10页
        1.2.2 主要内容第10-11页
        1.2.3 创新点第11-12页
第2章 文本挖掘相关理论与研究第12-19页
    2.1 文本挖掘概述第12-14页
        2.1.1 文本挖掘的定义第12页
        2.1.2 文本挖掘的任务第12-13页
        2.1.3 文本挖掘的难点第13-14页
    2.2 中文文本挖掘的关键技术第14-16页
        2.2.1 文本表示第14-15页
        2.2.2 中文文本分词第15-16页
    2.3 短文本挖掘和微博文本挖掘第16-19页
        2.3.1 短文本挖掘第16-17页
        2.3.2 国外微博研究现状第17页
        2.3.3 国内微博研究现状第17-19页
第3章 基于LDA模型和信息熵的微博主题抽取第19-28页
    3.1 主题模型第19-20页
    3.2 潜在狄利克雷分布第20-22页
    3.3 基于LDA的主题模型拓展第22-24页
        3.3.1 MB-LDA模型第22-23页
        3.3.2 AuthorTopic模型第23-24页
    3.4 主题模型评估与主题数目确定第24-25页
    3.5 基于信息熵的微博主题加权第25-28页
        3.5.1 主题的信息熵第26-27页
        3.5.2 主题加权第27-28页
第4章 微博热度评分第28-40页
    4.1 微博热度相关数据第28页
    4.2 热度计算方法第28-33页
        4.2.1 话题的热度计算第29-30页
        4.2.2 微博用户热度计算第30-32页
        4.2.3 微博的热度计算第32-33页
    4.3 排名算法第33-38页
        4.3.1 PageRank算法第33-35页
        4.3.2 基于用户投票的排名算法第35-38页
    4.4 微博热度评分函数第38-40页
        4.4.1 微博内部热度和外部热度计算第38-39页
        4.4.2 热度评分函数第39-40页
第5章 热门微博发现的模型实现与结果分析第40-46页
    5.1 数据准备与预处理第40-41页
    5.2 参数设置和评价指标第41-42页
    5.3 实验结果分析第42-46页
        5.3.1 微博主题挖掘结果第42-43页
        5.3.2 微博内部热度结果第43-44页
        5.3.3 结果对比第44-46页
第6章 总结与展望第46-48页
    6.1 本文总结第46页
    6.2 研究展望第46-48页
参考文献第48-51页
后记第51页

论文共51页,点击 下载论文
上一篇:税务和解研究--基于A公司与税务机关的争议
下一篇:基于模型平均的中国总和生育率估计