首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

大规模多臂赌博机算法研究与应用

中文摘要第4-6页
abstract第6-7页
第一章 引言第10-17页
    1.1 研究背景及意义第10-11页
    1.2 研究现状第11-14页
    1.3 研究内容第14-15页
    1.4 论文组织结构第15-17页
第二章 基础理论概述第17-22页
    2.1 强化学习第17-18页
    2.2 经典多臂赌博机第18-19页
    2.3 大规模多臂赌博机第19-20页
    2.4 上下文多臂赌博机第20-22页
第三章 自适应的多臂赌博机算法第22-37页
    3.1 算法描述第22页
    3.2 算法实现第22-25页
    3.3 regret分析第25-28页
    3.4 实验结果分析第28-36页
        3.4.1 随机数据集第29-33页
        3.4.2 内容分发网络第33-35页
        3.4.3 推荐系统第35-36页
    3.5 本章小结第36-37页
第四章 大规模多臂赌博机算法第37-44页
    4.1 算法描述第37页
    4.2 算法实现第37-40页
        4.2.1 同步更新第37-39页
        4.2.2 异步更新第39-40页
    4.3 收敛性分析第40页
    4.4 实验结果分析第40-43页
        4.4.1 不同更新方式第40-42页
        4.4.2 学习率第42页
        4.4.3 大规模推荐系统第42-43页
    4.5 本章小结第43-44页
第五章 大规模上下文多臂赌博机算法第44-53页
    5.1 算法描述第44页
    5.2 算法实现第44-49页
        5.2.1 上下文先验概率第44-47页
        5.2.2 基于动作选择概率的估计方法第47-49页
    5.3 实验结果分析第49-52页
        5.3.1 大规模上下文推荐系统第49-51页
        5.3.2 动作估计方法第51-52页
    5.4 本章小结第52-53页
第六章 总结与展望第53-56页
    6.1 总结第53-54页
    6.2 展望第54-56页
参考文献第56-61页
攻读硕士学位期间公开发表(录用)的论文及参与的项目第61-62页
    一、公开发表(录用)的学术论文第61页
    二、专利第61页
    三、参加的科研项目第61-62页
致谢第62-63页

论文共63页,点击 下载论文
上一篇:混合无线传感网中可信信息覆盖空洞修补策略研究
下一篇:基于局部标注的依存句法分析研究