首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于微博自身特征的热点话题发现研究

摘要第4-5页
Abstract第5-6页
1 绪论第10-16页
    1.1 研究背景及意义第10-11页
        1.1.1 研究背景第10页
        1.1.2 研究意义第10-11页
    1.2 研究现状第11-14页
        1.2.1 国外研究现状第11-12页
        1.2.2 国内研究现状第12-14页
    1.3 本文主要研究内容第14页
    1.4 本文组织结构第14-16页
2 相关技术研究第16-27页
    2.1 话题检测与跟踪技术第16-17页
        2.1.1 基本概念第16页
        2.1.2 任务划分第16-17页
    2.2 信息检索模型第17-21页
        2.2.1 布尔模型第17-18页
        2.2.2 向量空间模型第18-19页
        2.2.3 语义分析模型第19-21页
    2.3 相似度计算方法第21-22页
    2.4 聚类算法介绍第22-26页
        2.4.1 划分聚类算法第23页
        2.4.2 层次聚类算法第23-24页
        2.4.3 密度聚类算法第24-25页
        2.4.4 网格聚类算法第25页
        2.4.5 模型聚类算法第25-26页
    2.5 本章小结第26-27页
3 基于微博特征的IH数据筛选方法第27-41页
    3.1 微博数据获取第27-30页
        3.1.1 微博API获取第27-29页
        3.1.2 网络爬虫获取第29-30页
        3.1.3 第三方平台获取第30页
    3.2 微博特点分析第30-38页
        3.2.1 用户角色特征分析第30-33页
        3.2.2 微博结构及传播特点分析第33-36页
        3.2.3 微博信息特点分析第36-38页
    3.3 IH数据筛选方法第38-40页
        3.3.1 微博长尾现象第38-39页
        3.3.2 IH数据筛选方法第39-40页
    3.4 本章小结第40-41页
4 基于微博特征的ISP-LDA话题发现方法第41-54页
    4.1 传统方法的不足及改进第41-42页
    4.2 数据预处理第42-44页
        4.2.1 文本净化第42-43页
        4.2.2 中文分词第43-44页
        4.2.3 去停用词第44页
    4.3 ISP算法话题初类发现第44-49页
        4.3.1 单遍聚类第44-45页
        4.3.2 ISP聚类算法第45-48页
        4.3.3 临界值确定第48-49页
    4.4 基于LDA模型的热点话题发现第49-53页
        4.4.1 主题模型第49-50页
        4.4.2 模型建立第50-52页
        4.4.3 参数推演第52-53页
        4.4.4 LDA生成过程第53页
    4.5 本章小结第53-54页
5 实验及结果分析第54-64页
    5.1 实验环境及评价方法第54-55页
        5.1.1 实验环境第54页
        5.1.2 评价方法第54-55页
    5.2 微博数据抓取过程及结果第55-57页
    5.3 IH数据筛选结果及分析第57-58页
    5.4 ISP-LDA算法结果及分析第58-63页
        5.4.1 ISP初类发现结果及分析第58-59页
        5.4.2 LDA建模过程及结果分析第59-63页
    5.5 本章小结第63-64页
6 总结与展望第64-66页
    6.1 工作总结第64页
    6.2 未来展望第64-66页
参考文献第66-69页
攻读硕士学位期间发表论文及科研成果第69-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:牛粪模拟储存期间NH3、CO2、CH4排放特征及减排措施研究
下一篇:唐古特大黄蒽醌提取工艺、水提部位化学成分离及抑菌活性的研究