首页--艺术论文--电影、电视艺术论文--电影、电视企业组织与管理论文--流通和放映论文

基于约简随机森林的电影票房预测分析

摘要第4-5页
Abstract第5页
第一章 绪论第8-11页
    1.1 研究背景第8-9页
    1.2 研究现状第9-10页
    1.3 本文工作第10-11页
第二章 获取电影信息的网络爬虫研究第11-21页
    2.1 网络爬虫简介第11-13页
        2.1.1 什么是网络爬虫第11页
        2.1.2 网络爬虫的策略第11-13页
    2.2 网络爬虫实现第13-16页
        2.2.1 网页抓取第13-15页
        2.2.2 网页解析第15-16页
    2.3 爬虫网站介绍第16-19页
        2.3.1 格瓦拉电影网第16-17页
        2.3.2 搜库网第17-18页
        2.3.3 中国网络视频指数第18-19页
        2.3.4 搜狗指数第19页
    2.4 数据存储第19-20页
        2.4.1 MySQL的概述第19页
        2.4.2 格瓦拉电影数据存储第19-20页
        2.4.3 搜库电影数据存储第20页
    2.5 小结第20-21页
第三章 约简随机森林的算法研究第21-29页
    3.1 决策树第21-22页
        3.1.1 决策树简介第21页
        3.1.2 决策树的发展第21-22页
        3.1.3 ID3和C4.5构建决策树第22页
    3.2 随机森林第22-26页
        3.2.1 集成学习简介第22-23页
        3.2.2 随机森林的定义第23-24页
        3.2.3 随机森林的强度和相关性第24-26页
        3.2.4 随机森林的特点第26页
    3.3 随机森林的约简方法第26-28页
        3.3.1 基于相似度的约简方法第26-27页
        3.3.2 基于分类间隔的约简方法第27页
        3.3.3 基于强度和相似性的约简方法第27-28页
    3.4 小结第28-29页
第四章 基于约简随机森林的电影票房预测模型第29-37页
    4.1 票房预测模型设计第29-30页
    4.2 电影票房数据分析第30-31页
    4.3 电影信息特征分析第31-34页
        4.3.1 百度指数第32页
        4.3.2 档期第32页
        4.3.3 导演和演员第32-33页
        4.3.4 类别第33页
        4.3.5 预告片搜索量第33-34页
        4.3.6 发行公司第34页
    4.4 票房预测结果及分析第34-36页
        4.4.1 约简随机森林的预测结果第34-35页
        4.4.2 对比其他分类模型第35-36页
    4.5 小结第36-37页
第五章 结语第37-38页
    5.1 总结第37页
    5.2 进一步工作第37-38页
参考文献第38-40页
发表论文和参加科研情况说明第40-41页
致谢第41-42页

论文共42页,点击 下载论文
上一篇:基于结构化字典学习的图像分类方法研究
下一篇:拖拉机用外啮合齿轮泵低温性能测试及改进