首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于云平台的网络新闻热点话题检测与发现

摘要第4-5页
ABSTRACT第5-6页
第一章 前言第9-17页
    1.1 课题研究背景第9-11页
    1.2 国内外研究现状第11-13页
    1.3 研究内容和文章结构第13-17页
        1.3.1 网络新闻数据的获取第14页
        1.3.2 新闻数据文档的建模第14页
        1.3.3 新闻网页的分类过程第14-15页
        1.3.4 新闻数据热点话题检测与发现第15页
        1.3.5 利用Hadoop解决海量数据处理问题第15-16页
        1.3.6 文章结构第16-17页
第二章 网络新闻数据的获取第17-23页
    2.1 网络新闻数据获取相关技术介绍第17-20页
        2.1.1 网络爬虫介绍第17-19页
        2.1.2 网页信息抽取相关技术第19-20页
    2.2 新闻网页信息的获取第20-23页
        2.2.1 网页信息的爬取第21页
        2.2.2 网页内容信息的抽取第21-23页
第三章 新闻数据文档的建模第23-33页
    3.1 利用向量空间模型建模第23-27页
        3.1.1 新闻文档的分词处理以及特征选择过程第24-25页
        3.1.2 新闻文档中热门新词的识别第25-26页
        3.1.3 利用VSM对新闻文档进行建模第26-27页
    3.2 利用主题模型LDA建模第27-31页
        3.2.1 LDA主题模型介绍第28-30页
        3.2.2 利用LDA主题模型建模第30-31页
    3.3 文档相似度的度量第31-33页
第四章 新闻热点话题检测与发现第33-46页
    4.1 新闻网页分类第33-38页
        4.1.1 文本分类技术相关介绍第33-35页
        4.1.2 基于质心的文本分类算法的实现第35-38页
    4.2 新闻热点话题检测与发现第38-46页
        4.2.1 文本聚类技术相关介绍第38-41页
        4.2.2 热点话题的初步检测与发现第41-43页
        4.2.3 子类新闻话题的合并第43-46页
第五章 基于Hadoop的网络新闻热点话题检测与发现的实验第46-61页
    5.1 Hadoop的介绍第46-48页
    5.2 实验的结果第48-61页
        5.2.1 新闻网页数据的抓取第48-50页
        5.2.2 新闻网页的建模第50-53页
        5.2.3 新闻网页的分类第53-56页
        5.2.4 网络热点话题检测与发现第56-61页
第六章 总结与展望第61-63页
    6.1 全文工作总结第61页
    6.2 展望未来第61-63页
参考文献第63-66页
致谢第66-67页
攻读学位期间发表的学术论文目录第67页

论文共67页,点击 下载论文
上一篇:空间编队DS-UWB通信多用户检测与LDPC编译码研究
下一篇:分布式多舰载地波超视距雷达数据融合算法的研究