首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于主题模型的微博话题挖掘

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-13页
    1.1 研究背景及意义第9-10页
    1.2 国内外研究现状第10页
    1.3 文章的研究内容和组织结构第10-13页
第二章 相关文本处理知识第13-24页
    2.1 微博信息采集技术第13-15页
        2.1.1 微博信息获取第13-14页
        2.1.2 微博信息提取第14-15页
    2.2 文本预处理第15-17页
        2.2.1 中文分词和词性标注技术第15-17页
        2.2.2 微博噪声处理第17页
    2.3 文本模型表示第17-21页
        2.3.1 向量空间模型(vsm)第17-19页
        2.3.2 隐性语义分析(lsa)第19-20页
        2.3.3 概率潜语义分析(plsa)第20-21页
    2.4 文本聚类算法第21-23页
        2.4.1 分割式聚类算法第21-22页
        2.4.2 结构式聚类算法第22-23页
        2.4.3 概率密度聚类算法第23页
    2.5 本章小结第23-24页
第三章 基于LDA主题模型的微博文本表示第24-36页
    3.1 传统文本模型的问题第24-25页
        3.1.1 中文词性标注的问题第24页
        3.1.2 文本模型的问题第24-25页
    3.2 中文词性标注第25-28页
        3.2.1 隐马尔可夫模型(HMM)第26-28页
        3.2.3 基于隐马可夫模型的中文词性标注第28页
    3.3 基于LDA主题模型的文本表示第28-31页
        3.3.1 LDA主题模型第28-30页
        3.3.2 吉布斯抽样算法第30-31页
    3.4 实验与分析第31-34页
        3.4.1 实验数据第31-32页
        3.4.2 语料预处理第32页
        3.4.3 实验结果第32-34页
    3.5 本章小结第34-36页
第四章 基于改进的Single-pass微博话题检测第36-45页
    4.1 Single-pass聚类挖掘概述第36-38页
        4.1.1 聚类算法比较第36-38页
        4.1.2 基于Single-pass话题检测流程第38页
    4.2 经典的Sinle-pass聚类算法第38-39页
    4.3 改进的Single-pass聚类算法第39-41页
        4.3.1 Single-pass的问题第39-40页
        4.3.2 Single-pass算法改进第40-41页
    4.4 实验与分析第41-44页
        4.4.1 性能评价指标第41-42页
        4.4.2 实验结果分析第42-44页
    4.5 本章小结第44-45页
第五章 微博话题检测系统的实现第45-52页
    5.1 系统需求设计第45-47页
        5.1.1 数据模块需求第46页
        5.1.2 文本预处理模块需求第46-47页
        5.1.3 话题检测模块需求第47页
        5.1.4 用户管理模块需求第47页
        5.1.5 日志管理模块需求第47页
    5.2 系统架构设计第47-48页
    5.3 功能模块设计第48-49页
        5.3.1 微博数据模块设计第48页
        5.3.2 文本预处理模块设计第48-49页
        5.3.3 话题检测模块设计第49页
    5.4 数据库设计第49-51页
    5.5 系统实现第51页
    5.6 本章小结第51-52页
第六章 总结与展望第52-54页
    6.1 全文总结第52-53页
    6.2 未来展望第53-54页
参考文献第54-57页
致谢第57-58页
作者攻读学位期间发表的学术论文目录第58页

论文共58页,点击 下载论文
上一篇:资源枯竭型城市经济转型与发展对策研究--以华蓥市为例
下一篇:复方参芩对细小病毒病犬心脏组织的保护作用及机理研究