首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于地理位置信息的中文微博突发话题检测技术研究

摘要第5-6页
Abstract第6页
第1章 绪论第10-16页
    1.1 课题的背景及意义第10-11页
    1.2 国内外研究现状第11-12页
    1.3 论文研究内容第12-13页
    1.4 论文组织结构第13-16页
第2章 相关技术第16-24页
    2.1 文本表示模型第16-18页
        2.1.1 向量空间模型第16-17页
        2.1.2 LDA模型第17-18页
    2.2 词语相似度计算方法第18-19页
    2.3 常用聚类算法第19-20页
        2.3.1 增量式聚类算法第19页
        2.3.2 层次式聚类算法第19-20页
    2.4 实验系统涉及技术第20-22页
        2.4.1 数据库第20-21页
        2.4.2 分词系统第21页
        2.4.3 Node运行环境第21-22页
    2.5 本章小结第22-24页
第3章 数据采集第24-40页
    3.1 数据集现状第24页
    3.2 常用数据采集方法第24-28页
        3.2.1 通过爬虫采集数据第25-26页
        3.2.2 通过API接口采集数据第26-28页
    3.3 微博数据采集第28-34页
        3.3.1 应用集获取第29-30页
        3.3.2 微博文本数据采集第30-33页
        3.3.3 微博地理位置信息转换第33-34页
    3.4 基于应用集调度策略的微博数据采集框架第34-38页
        3.4.1 微博文本数据采集框架第34-36页
        3.4.2 微博地理位置信息转换框架第36-38页
    3.5 实验对比分析第38-39页
    3.6 本章小结第39-40页
第4章 基于地理位置信息的微博突发话题检测第40-58页
    4.1 微博文本预处理第40-45页
        4.1.1 微博文本过滤第41-44页
        4.1.2 分词过滤第44-45页
    4.2 基于地理位置信息的突发词抽取第45-50页
        4.2.1 事件亲历者识别第46页
        4.2.2 词语权重计算第46-48页
        4.2.3 用户影响力计算第48-50页
        4.2.4 词语突发度计算及突发词抽取第50页
    4.3 突发话题检测第50-53页
        4.3.1 突发词相似度计算第51页
        4.3.2 突发词聚类第51-52页
        4.3.3 微博突发话题检测第52-53页
    4.4 基于地理位置信息的突发话题检测框架第53-56页
    4.5 本章小结第56-58页
第5章 实验与结果分析第58-72页
    5.1 实验环境与评价标准第58-60页
        5.1.1 实验环境第58页
        5.1.2 评价标准第58-60页
    5.2 数据预处理第60-61页
        5.2.1 数据过滤第60页
        5.2.2 数据分词第60-61页
    5.3 突发话题检测第61-64页
        5.3.1 词语权重计算第61-62页
        5.3.2 单个时间窗内的词语权重计算第62-64页
        5.3.3 突发词抽取与聚类第64页
    5.4 实验与结果分析第64-70页
        5.4.1 突发话题检测结果与分析第65-67页
        5.4.2 召回率、准确率、F值对比第67-69页
        5.4.3 时间性能对比第69-70页
    5.5 本章小结第70-72页
结论第72-74页
参考文献第74-78页
攻读硕士学位期间发表的论文和取得的科研成果第78-80页
致谢第80页

论文共80页,点击 下载论文
上一篇:分布式系统中环形拓扑式通讯故障容灾方法研究
下一篇:社区居家养老服务系统及相关技术研究设计