首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于层次聚类的新闻话题发现技术研究

摘要第5-6页
ABSTRACT第6页
第1章 绪论第9-13页
    1.1 课题研究的背景及意义第9-10页
    1.2 国内外研究现状第10-12页
    1.3 本文的主要工作和章节安排第12-13页
第2章 话题发现的相关技术第13-28页
    2.1 主题模型第13-19页
        2.1.1 LDA简介第13页
        2.1.2 LDA模拟文本集的生成过程第13-14页
        2.1.3 LDA的吉布斯采样过程第14-15页
        2.1.4 基于LDA的扩展模型第15-19页
    2.2 话题的关联计算方法第19-22页
        2.2.1 相对熵第19页
        2.2.2 基于种子文档的关联法第19-20页
        2.2.3 基于随机游走的关联法第20-21页
        2.2.4 基于特征词演变特点的方法第21-22页
    2.3 聚类算法第22-27页
        2.3.1 贝叶斯层次聚类第22-24页
        2.3.2 贝叶斯玫瑰树第24-25页
        2.3.3 NetClus算法第25-27页
    2.4 本章小结第27-28页
第3章 基于层次聚类的话题发现第28-37页
    3.1 话题发现流程设计第28-33页
        3.1.1 基本流程第28-29页
        3.1.2 新闻文本的预处理第29-30页
        3.1.3 新闻话题的抽取第30-32页
        3.1.4 话题在新词表上的平滑第32-33页
    3.2 基于层次聚类的话题层次关系提取第33-36页
        3.2.1 改进的BRT算法第33-35页
        3.2.2 提取主题的层次关系第35-36页
    3.3 本章小结第36-37页
第4章 实验设计第37-50页
    4.1 实验语料第37-38页
    4.2 评测方法第38-40页
        4.2.1 困惑度第38页
        4.2.2 相对评价法第38-39页
        4.2.3 NMI与CNE第39-40页
    4.3 实验结果与分析第40-49页
        4.3.1 改进的BRT算法对比第40-43页
        4.3.2 LDA模型主题数的选择第43-45页
        4.3.3 话题间的层次结构第45-47页
        4.3.4 话题关联结果第47-49页
    4.4 本章小结第49-50页
第5章 总结与展望第50-52页
    5.1 本文工作总结第50页
    5.2 进一步工作展望第50-52页
参考文献第52-55页
在校期间发表的论文、科研成果等第55-56页
致谢第56页

论文共56页,点击 下载论文
上一篇:生态课堂理念下的高中美术教学方法的改革--以荆门市第一中学为例
下一篇:大学生平时成绩量化管理系统的研究与实现