首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于最大树划分的微博热点话题检测方法研究

摘要第3-4页
ABSTRACT第4-5页
1 绪论第8-12页
    1.1 课题研究背景及意义第8页
    1.2 国内外研究现状第8-10页
        1.2.1 国外研究现状第8-9页
        1.2.2 国内研究现状第9-10页
    1.3 论文的研究目的和研究内容第10-11页
        1.3.1 研究目的第10页
        1.3.2 研究内容第10-11页
    1.4 论文的组织结构第11-12页
2 微博热点话题检测相关理论和技术第12-26页
    2.1 微博热点话题概述第12-14页
        2.1.1 微博系统介绍第12-13页
        2.1.2 微博热点话题第13-14页
    2.2 话题检测与跟踪第14-15页
    2.3 话题检测相关技术第15-25页
        2.3.1 中文分词和停用词过滤第16-17页
        2.3.2 话题模型第17-21页
        2.3.3 特征项赋权第21-22页
        2.3.4 相似度策略第22-24页
        2.3.5 聚类算法第24-25页
    2.4 本章小结第25-26页
3 微博数据采集与微博信息预处理第26-36页
    3.1 微博数据采集第26-32页
        3.1.1 利用开放平台 API 提取微博数据第26-30页
        3.1.2 利用改进的网络爬虫提取微博数据第30-32页
    3.2 微博信息预处理第32-35页
        3.2.1 去除交互标识符第32-34页
        3.2.2 去除微博中的 URL第34页
        3.2.3 过滤广告微博第34-35页
        3.2.4 繁体字转换为简体字第35页
    3.3 本章小结第35-36页
4 基于最大树划分的微博热点话题检测方法第36-47页
    4.1 方法的提出第36-39页
        4.1.1 现有微博话题检测方法存在的问题第36-38页
        4.1.2 本文方法的提出第38-39页
    4.2 基于最大树划分的微博热点话题检测方法的思想第39-40页
    4.3 文本建模第40-42页
        4.3.1 中文分词和停用词过滤第41页
        4.3.2 确定空间向量模型的维度第41页
        4.3.3 特征项赋权第41-42页
        4.3.4 构建空间向量模型第42页
    4.4 最大树划分第42-45页
        4.4.1 构造模糊相似矩阵第42-43页
        4.4.2 最大树生成第43-44页
        4.4.3 最大树的聚类划分第44-45页
    4.5 微博话题热度评估第45-46页
    4.6 本章小结第46-47页
5 实验及结果分析第47-54页
    5.1 实验环境第47页
    5.2 实验数据及预处理第47-49页
    5.3 评测标准第49-50页
    5.4 确定语义相似度阈值参数第50-51页
    5.5 话题检测算法性能测试第51-52页
    5.6 结合了语义的计算方法的性能测试第52-53页
    5.7 本章小结第53-54页
6 总结与展望第54-56页
    6.1 全文工作总结第54-55页
    6.2 工作展望第55-56页
致谢第56-57页
参考文献第57-61页
附录第61页
    A. 作者在攻读硕士学位期间发表的论文目录第61页
    B. 作者在攻读硕士学位期间参与的科研项目第61页

论文共61页,点击 下载论文
上一篇:基于MDA的面向方面建模工具的研究
下一篇:多核处理器片上光互连的研究