首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于分布式的新闻爬取和推荐系统的设计与实现

摘要第8-10页
ABSTRACT第10-11页
第1章 绪论第12-16页
    1.1 系统开发背景和意义第12-13页
    1.2 国内外同类技术现状第13-14页
    1.3 本文的主要工作内容第14-15页
    1.4 论文的组织结构第15-16页
第2章 需求分析第16-24页
    2.1 系统概述第16页
    2.2 系统可行性分析第16-17页
    2.3 系统功能需求第17-22页
        2.3.1 新闻个性化推荐功能第18-20页
        2.3.2 新闻检索功能第20页
        2.3.3 个性化设置功能第20-22页
    2.4 系统非功能性需求第22-24页
第3章 系统设计第24-58页
    3.1 系统总体架构设计第24-25页
    3.2 功能设计第25-29页
    3.3 新闻爬取子系统设计第29-35页
        3.3.1 Nutch分布式爬虫模块设计第29-33页
        3.3.2 新闻信息抽取模块设计第33-35页
        3.3.3 新闻存储模块设计第35页
    3.4 新闻特征学习子系统设计第35-42页
        3.4.1 BOW模型第36页
        3.4.2 LDA模型第36-38页
        3.4.3 基于Spark MLlib的新闻特征学习子系统流程设计第38-42页
    3.5 用户特征建模子系统设计第42-48页
        3.5.1 用户行为日志收集模块设计第42-47页
        3.5.2 用户特征建模模块设计第47-48页
    3.6 新闻推荐子系统设计第48-50页
    3.7 新闻检索子系统设计第50-54页
        3.7.1 Solr搜索引擎Schema设计第50-52页
        3.7.2 新闻检索子系统接口设计第52-54页
    3.8 数据库设计第54-58页
        3.8.1 前台web应用数据库设计第54-55页
        3.8.2 系统后台数据库设计第55-58页
第4章 系统实现第58-76页
    4.1 系统开发环境第58页
    4.2 新闻爬取子系统实现第58-62页
        4.2.1 新闻信息抽取模块实现第58-61页
        4.2.2 新闻存储模块实现第61-62页
    4.3 新闻特征学习子系统实现第62-65页
    4.4 用户特征建模子系统实现第65-72页
        4.4.1 用户行为日志收集模块实现第65-67页
        4.4.2 Spark Streaming处理日志第67-72页
    4.5 新闻推荐子系统实现第72-74页
    4.6 新闻检索子系统实现第74-76页
第5章 总结和展望第76-78页
参考文献第78-80页
致谢第80-81页
学位论文评阅及答辩情况表第81页

论文共81页,点击 下载论文
上一篇:基于显微视觉的微纳运动平台位移测量方法研究
下一篇:聊城市工业企业技术改造管理系统的设计与实现