首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

博客话题与新闻话题关联方法研究

摘要第3-4页
ABSTRACT第4页
目录第5-8页
图录第8-9页
表录第9-11页
第一章 绪论第11-13页
    1.1 研究背景第11页
    1.2 研究目的第11-12页
    1.3 研究内容第12页
    1.4 论文主要内容与章节安排第12-13页
第二章 相关研究工作介绍第13-23页
    2.1 新闻研究概述与博客研究现状第13-14页
        2.1.1 新闻研究概述第13页
        2.1.2 博客研究现状第13-14页
    2.2 博客常用话题模型第14-18页
        2.2.1 LDA 模型第14-15页
        2.2.2 标签-话题模型(tag-topic model)第15-17页
        2.2.3 Labeled-LDA第17-18页
    2.3 新闻-博文研究第18-22页
        2.3.1 新闻报道-博客文档关联第19-20页
        2.3.2 热点新闻发现第20-22页
    2.4 本章小结第22-23页
第三章 博文话题发现第23-31页
    3.1 博文语料的特征第23-25页
        3.1.1 博文的结构特征第23-24页
        3.1.2 博文的内容特征第24-25页
    3.2 博文话题识别第25-30页
        3.2.1 话题定义第25-26页
        3.2.2 博文话题词的加权与筛选第26-28页
        3.2.3 话题模型第28-30页
        3.2.4 话题模型选择标准第30页
    3.3 本章小结第30-31页
第四章 新闻话题与博文话题关联方法第31-42页
    4.1 关联度获取第31-34页
        4.1.1 欧几里得距离(Euclidean Distance)第31-32页
        4.1.2 余弦相似度(Cosine Similarity)第32页
        4.1.3 Hellinger 距离(Hellinger distance)第32-33页
        4.1.4 Tanimoto 系数(广义 Jaccard 系数)第33页
        4.1.5 JS 距离(Jensen-shannon Divergence)第33-34页
    4.2 关联结果优化第34-40页
        4.2.1 基于投票的关联结果判定第34-38页
        4.2.2 投票系统的改进——投票权第38-40页
    4.3 本章小结第40-42页
第五章 实验结果及分析第42-77页
    5.1 实验语料第42-46页
        5.1.1 语料获取第42-43页
        5.1.2 对获取语料的预处理第43-46页
    5.2 话题模型构建第46-56页
        5.2.1 参数和模型设定第46页
        5.2.2 关联方法的阈值选取第46-52页
        5.2.3 话题模型的结果第52-56页
    5.3 关联度比较分析第56-66页
        5.3.1 欧几里得距离第57-59页
        5.3.2 余弦相似度第59-62页
        5.3.3 Hellinger 距离第62-63页
        5.3.4 Tanimoto 系数第63-64页
        5.3.5 JS 距离第64-66页
        5.3.6 关联度比较分析小结第66页
    5.4 投票系统第66-73页
    5.5 评测指标第73-74页
    5.6 测评结果分析第74-76页
    5.7 本章小结第76-77页
第六章 总结与展望第77-79页
    6.1 全文总结第77页
    6.2 进一步的工作第77-79页
参考文献第79-82页
致谢第82-83页
攻读硕士学位期间已发表或录用的论文第83-85页

论文共85页,点击 下载论文
上一篇:基于BDCT域系数分析图像拼接检测算法研究
下一篇:基于多神经网络的软件可靠性组合预测方法研究