首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

新闻热点话题发现及演化分析研究与应用

摘要第3-4页
Abstract第4页
第1章 绪论第10-14页
    1.1 研究背景及目的第10-11页
    1.2 研究现状第11-12页
    1.3 本文主要工作第12-13页
    1.4 本文结构安排第13-14页
第2章 相关理论与技术第14-22页
    2.1 话题检测与追踪基本概念第14页
    2.2 网络新闻报道文本预处理第14-16页
        2.2.1 中文分词第15页
        2.2.2 特征词提取第15-16页
    2.3 新闻报道相似度计算第16-18页
    2.4 类簇相似度计算第18页
    2.5 文本挖掘技术第18-20页
        2.5.1 划分聚类算法第19-20页
        2.5.2 层次聚类算法第20页
    2.6 本章小结第20-22页
第3章 网络新闻话题聚类第22-44页
    3.1 主题模型引入第22-23页
    3.2 相关统计模型第23-27页
        3.2.1 Baves Unigram Model第23-24页
        3.2.2 概率潜在语义分析(PLSA)第24-27页
    3.3 基于LDA模型新闻话题聚类建模第27-30页
        3.3.1 LDA主题模型第27-28页
        3.3.2 Gibbs采样第28-29页
        3.3.3 潜在主题数K值确定第29页
        3.3.4 LDA模型下文本向量建模第29-30页
    3.4 改进K-means算法在新闻话题聚类上的应用第30-32页
        3.4.1 初始聚类中心选择第30-31页
        3.4.2 自生成话题数K第31-32页
    3.5 基于复合相似度和多核心模型新闻话题聚类第32-37页
        3.5.1 复合相似度计算第32-34页
        3.5.2 多核心话题描述模型第34页
        3.5.3 多核心模型构造方法第34-35页
        3.5.4 算法整体框架与流程第35-37页
    3.6 话题聚类实验与结果分析第37-43页
        3.6.1 实验环境第37页
        3.6.2 实验语料第37页
        3.6.3 话题聚类评价标准第37-38页
        3.6.4 相似度平衡因子χ的确定第38-40页
        3.6.5 新闻话题聚类最小相似度阈值确定第40-41页
        3.6.6 新闻话题聚类结果分析第41-43页
    3.7 本章小结第43-44页
第4章 热点话题识别及演化分析第44-56页
    4.1 热点话题概念第44-45页
    4.2 热点话题发现模型第45-46页
        4.2.1 基于改进TF-PDF的媒体关注度模型第45-46页
        4.2.2 基于用户浏览行为的用户关注度模型第46页
        4.2.3 新闻热点话题发现复合关注度模型第46页
    4.3 热点话题发现算法整体流程第46-48页
    4.4 热点话题演化发展过程分析第48-51页
        4.4.1 话题发展走势分析第48-50页
        4.4.2 话题演化偏移分析第50-51页
    4.5 热点话题发现及演化实验与结果第51-54页
        4.5.1 热点话题发现第51-53页
        4.5.2 热点话题发展走势曲线第53页
        4.5.3 热点话题演化分析第53-54页
    4.6 本章小结第54-56页
第5章 系统设计与实现第56-65页
    5.1 系统整体框架设计第57-58页
    5.2 核心模块设计第58-62页
        5.2.1 新闻数据采集模块第58-59页
        5.2.2 新闻报道预处理模块第59-60页
        5.2.3 热点话题发现模块第60-61页
        5.2.4 热点话题演化分析模块第61-62页
    5.3 系统关键场景展示第62-64页
    5.4 本章小结第64-65页
第6章 总结与展望第65-67页
    6.1 本文总结第65-66页
    6.2 未来工作展望第66-67页
致谢第67-68页
参考文献第68-71页
附录第71页

论文共71页,点击 下载论文
上一篇:基于雷达与图像信息融合的路面目标识别与应用
下一篇:2015版新版人民币图像特征的鉴伪研究