首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

新闻类信息的组织和话题监控

摘要第4-5页
ABSTRACT第5-6页
第一章 概述第9-11页
    1.1 论文研究的背景和意义第9-10页
    1.2 论文研究内容第10页
    1.3 论文组织结构第10-11页
第二章 相关背景知识第11-15页
    2.1 内容组织的现状第11-13页
        2.1.1 信息采集技术第11-12页
        2.1.2 聚类技术第12页
        2.1.3 分类技术第12-13页
    2.2 话题监控研究现状第13-14页
        2.2.1 话题检测第13-14页
        2.2.2 话题跟踪第14页
        2.2.3 时序传播第14页
    2.3 新闻平台挖掘的研究现状第14-15页
第三章 应用环境分析第15-17页
    3.1 新闻内容概述第15页
    3.2 话题分布特点第15-16页
    3.3 话题传播特点第16-17页
第四章 话题信息采集第17-20页
    4.1 新闻来源第17页
    4.2 爬虫模块第17-18页
    4.3 预处理模块第18-19页
    4.4 存储模块第19-20页
第五章 新闻内容组织第20-33页
    5.1 基于HFTC算法的文本聚类组织第20-24页
        5.1.1 传统文本聚类算法第20页
        5.1.2 基于频繁词条集的文本聚类算法第20-23页
        5.1.3 引入索引第23-24页
    5.2 文章分类组织第24-26页
    5.3 实验测评第26-33页
        5.3.1 HFTC聚类组织第26-29页
        5.3.2 朴素贝叶斯分类器进行分类组织第29-33页
第六章 话题发现第33-53页
    6.1 话题发现基本技术第33-36页
        6.1.1 Single Pass算法第33-35页
        6.1.2 NMF/LDA算法第35-36页
    6.2 基于WBN-FTC的话题发现第36-41页
        6.2.1 新算法优势第36-37页
        6.2.2 小世界模型第37-38页
        6.2.3 词的置信网络(Word Belief Network)第38-40页
        6.2.4 图切割策略第40-41页
    6.3 针对发现话题进行推荐第41-43页
        6.3.1 协同过滤推荐引擎第41-42页
        6.3.2 矩阵分解对协同过滤的优化第42-43页
    6.4 话题摘要的生成第43页
    6.5 实验测评第43-53页
        6.5.1 传统方法第43-46页
        6.5.2 WBN-FTC第46-53页
第七章 话题跟踪及其动态特征第53-62页
    7.1 话题跟踪第53-56页
        7.1.1 传统思路第53-54页
        7.1.2 利用分类器组合方法进行话题跟踪第54-56页
    7.2 话题的时间特征第56-59页
        7.2.1 在线新闻话题发现的三个阶段第56-57页
        7.2.2 将时间特征引入话题监控范畴第57页
        7.2.3 基于时间维度上的特征进行话题走势预测第57-58页
        7.2.4 通过分析时间特征进行模式识别第58-59页
    7.3 实验测评第59-62页
第八章 结论第62-63页
参考文献第63-65页
致谢第65-66页
作者攻读学位期间发表的学术论文目录第66页

论文共66页,点击 下载论文
上一篇:语音检索中识别错误处理研究
下一篇:对象检索中的实体信息查询扩展算法研究