首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于公共微博数据和收视行为数据的电视用户画像研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-18页
    1.1 课题背景与意义第10-12页
        1.1.1 电视用户画像的背景与意义第10-11页
        1.1.2 使用公共微博数据的背景与意义第11-12页
    1.2 课题研究现状第12-14页
        1.2.1 微博的研究现状第12-13页
        1.2.2 电视用户画像的研究现状第13-14页
    1.3论文的研究内容第14-16页
    1.4 论文的创新点第16-17页
    1.5 论文的组织结构第17-18页
第二章 相关技术第18-24页
    2.1 微博数据抓取和清洗技术第18-19页
        2.1.1 基于selenium的网络爬虫第18页
        2.1.2 TF-IDF方法第18-19页
    2.2 构建模型所需的分类算法第19-24页
        2.2.1 决策树第19-21页
        2.2.2 梯度提升决策树(Gradient Boosting Decision Tree)第21-24页
第三章 收视数据与微博数据处理第24-34页
    3.1 电视用户收视数据清洗第24-26页
    3.2 微博爬虫实现第26-28页
        3.2.1 多账号登录第27页
        3.2.2 关键词搜索第27-28页
        3.2.3 解析页面第28页
    3.3 微博数据的清洗第28-34页
第四章 电视用户画像研究第34-46页
    4.1 电视用户画像标签的定义第34-36页
    4.2 利用微博数据构建训练模型第36-42页
        4.2.1 多标签分类问题第36页
        4.2.2 基于微博数据的标签模型的构建第36-39页
            4.2.2.1 性别标签模型构造第37页
            4.2.2.2 年龄标签模型构造第37-39页
            4.2.2.3 兴趣偏好标签模型构造第39页
        4.2.3 使用xgboost构造模型第39-41页
        4.2.4 实验证明标签与电视节目的相关性第41-42页
    4.3 使用微博用户数据模型预测电视用户的用户画像第42-46页
第五章 电视用户画像实验第46-56页
    5.1 实验数据第46-47页
    5.2 传统的基于EPG和TF-IDF的电视用户画像方法第47-49页
    5.3 用户画像准确性评估方法第49-52页
        5.3.1 Fepg评估方法第49-50页
        5.3.2 Fweibo评估方法第50-51页
        5.3.3 推荐成功率评估标准第51-52页
    5.4 实验结果分析第52-56页
第六章 总结与展望第56-60页
    6.1 总结第56-57页
    6.2 展望第57-60页
参考文献第60-62页
致谢第62-64页
攻读学位期间取得的研究成果第64页

论文共64页,点击 下载论文
上一篇:基于SDN技术的互联网安全平台的研究与实现
下一篇:基于Bigpipe与Node.js的Web框架的设计与实现