首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于微博的热点话题提取

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第11-15页
    1.1 课题研究的背景及意义第11-12页
    1.2 国内外研究现状第12-13页
    1.3 论文的内容安排第13-15页
第二章 相关技术综述第15-31页
    2.1 微博抓取第15-19页
        2.1.1 网络爬虫第15-18页
        2.1.2 定制微博爬虫第18-19页
    2.2 结构化存储第19-21页
    2.3 中文分词第21-22页
    2.4 文本特征提取第22-24页
        2.4.1 TF-IDF特征第22-23页
        2.4.2 特征选择与特征降维方法第23-24页
    2.5 聚类算法第24-31页
        2.5.1 层次聚类算法第25-26页
        2.5.2 基于划分的聚类算法第26页
        2.5.3 基于密度的聚类算法第26-28页
        2.5.4 基于网格的聚类算法第28-29页
        2.5.5 Single-Pass聚类算法第29-31页
第三章 话题聚类第31-57页
    3.1 预处理第31-33页
        3.1.1 微博筛选第31-32页
        3.1.2 中文分词第32页
        3.1.3 词筛选第32-33页
    3.2 向量空间模型第33页
    3.3 概率生成模型第33-36页
        3.3.1 一元模型第34页
        3.3.2 一元混合模型第34页
        3.3.3 LSI和pLSI模型第34-36页
    3.4 LDA模型建模与求解第36-46页
        3.4.1 生成模型建模第37-38页
        3.4.2 确定主题数K第38-39页
        3.4.3 吉布斯抽样第39-40页
        3.4.4 模型求解第40-44页
        3.4.5 迭代终止条件第44-45页
        3.4.6 模型有效性分析第45-46页
    3.5 聚类算法的比较与选取第46-48页
    3.6 点到类的相似度度量第48-49页
    3.7 Single-Pass算法优化第49-52页
    3.8 聚类效果评估第52-54页
        3.8.1 测试数据与参数选择第52-54页
        3.8.2 聚类结果分析第54页
    3.9 小结第54-57页
第四章 类内话题词提取第57-63页
    4.1 类内话题词提取框架第57页
    4.2 话题词提取预处理第57-58页
        4.2.1 中文分词第58页
        4.2.2 生成候选词第58页
    4.3 词间关联度计算第58-60页
        4.3.1 词共现研究现状第58-59页
        4.3.2 基于词共现模型的词语关联度计算第59-60页
    4.4 话题词聚类第60-61页
    4.5 话题词提取结果第61页
    4.6 小结第61-63页
第五章 微博热点话题提取系统第63-71页
    5.1 话题发现系统实现第63-64页
    5.2 系统运行环境和参数第64页
    5.3 系统结果展示第64-70页
    5.4 小结第70-71页
第六章 总结与展望第71-73页
    6.1 论文主要工作和创新第71-72页
    6.2 工作展望第72-73页
参考文献第73-75页
致谢第75-77页
攻读硕士学位期间发表的学术论文第77页

论文共77页,点击 下载论文
上一篇:监控视频事件检测算法
下一篇:SC-FDE通信系统中LDPC编译码技术研究及FPGA实现