首页--文化、科学、教育、体育论文--信息与知识传播论文--新闻学、新闻事业论文--新闻学论文--新闻工作自动化、网络化论文

基于数据挖掘的网络新闻热点发现系统设计与实现

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-16页
    1.1 研究背景第10页
    1.2 国内外研究现状第10-12页
        1.2.1 文本向量化研究现状第11页
        1.2.2 新闻文本聚类算法研究现状第11-12页
        1.2.3 话题抽取算法研究现状第12页
    1.3 论文的研究内容及创新点第12-13页
    1.4 论文组织结构第13页
    1.5 小结第13-16页
第二章 热点发现系统相关技术第16-30页
    2.1 数据挖掘第16-23页
        2.1.1 数据挖掘的概念第16-17页
        2.1.2 数据挖掘的常见问题第17-20页
        2.1.3 数据挖掘的常用模型与算法第20-23页
    2.2 文本预处理第23-26页
        2.2.1 文本分词第23-24页
        2.2.2 文本向量化表示第24-26页
    2.3 聚类技术第26-30页
        2.3.1 相似度计算方法第27-28页
        2.3.2 聚类模型第28-30页
第三章 新闻热点发现系统关键模型设计第30-56页
    3.1 新闻文本聚类模型第30-48页
        3.1.1 MinHash算法第30-35页
        3.1.2 文本标签向量模型第35-39页
        3.1.3 Label-Vec密度聚类算法第39-48页
    3.2 热点话题抽取与热度值计算模型第48-54页
        3.2.1 基于LDA主题模型的话题抽取第49-53页
        3.2.2 热度值计算公式第53-54页
    3.3 小结第54-56页
第四章 新闻热点发现系统的实现与分析第56-70页
    4.1 系统模块与流程第56-57页
    4.2 系统开发与实验环境第57页
    4.3 文本数据获取模块实现第57-61页
        4.3.1 新闻语料数据采集系统实现第58-59页
        4.3.2 新闻内容结构化处理模块实现第59页
        4.3.3 数据仓库系统实现第59-61页
    4.4 文本聚类模块实现第61-62页
    4.5 热点话题抽取模块实现第62-63页
    4.6 功能性测试与分析第63-64页
    4.7 性能测试与分析第64-68页
        4.7.1 实验设计第64-65页
        4.7.2 算法复杂度分析第65页
        4.7.3 模型性能分析第65-68页
    4.8 小结第68-70页
第五章 总结与展望第70-72页
    5.1 总结第70页
    5.2 展望第70-72页
参考文献第72-76页
致谢第76-78页
攻读学位期间发表的学术论文第78页

论文共78页,点击 下载论文
上一篇:2008-2017年中文类体育核心期刊中竞技健美操研究的文献计量分析
下一篇:基于深度学习的短文本自动摘要方法研究