首页--数理科学和化学论文--概率论与数理统计论文--数理统计论文--贝叶斯统计论文

非标准Multi-armed bandit的随机调度

摘要第11-13页
ABSTRACT(英文摘要)第13-14页
主要符号对照表第16-17页
第一章 引言第17-23页
    §1.1 Multi-armed bandits问题简介第17-20页
        §1.1.1 为什么研究Multi-armed bandits?第17-18页
        §1.1.2 研究现状与发展趋势第18-20页
    §1.2 本文的主要工作第20-21页
    §1.3 基础知识第21-23页
第二章 带限制的最优停时问题第23-47页
    §2.1 模型和性质第24-29页
        §2.1.1 最优停时问题模型第24-26页
        §2.1.2 两价值函数的性质和最优停时第26-29页
    §2.2 最优停时第29-35页
        §2.2.1 最小的最优停时第29-33页
        §2.2.2 最大最优停时第33-35页
    §2.3 其他特征第35-39页
        §2.3.1 局部化的价值函数和价值与报酬相等情形第35-36页
        §2.3.2 价值函数另外的正则性特征第36-39页
        §2.3.3 价值函数的汇聚第39页
    §2.4 最优双停时问题第39-43页
    §2.5 可及集的可列停时分解性质第43-45页
        §2.5.1 有关概念和性质第43-44页
        §2.5.2 主要结论第44-45页
    §2.6 本章小结第45-47页
第三章 带切换限制的MAB第47-73页
    §3.1 问题的提出第47-49页
    §3.2 随机时间集上的最优停时问题第49-55页
        §3.2.1 模型与问题背景第49-51页
        §3.2.2 最优停时的求解第51-55页
    §3.3 带切换限制的MAB第55-70页
        §3.3.1 模型说明第56-57页
        §3.3.2 单个arm的Gittins指标过程第57-65页
        §3.3.3 具有限制性的Multi-armed bandit最优调度问题第65-70页
    §3.4 偏序集上带限制的最优停时问题第70-72页
    §3.5 本章小结第72-73页
第四章 变折现率的RAP第73-91页
    §4.1 变折现率的RAP的指数策略的最优性第73-84页
        §4.1.1 模型说明第73-74页
        §4.1.2 单个arm的Gittins指数过程第74-81页
        §4.1.3 变折现率的RAP的最优策略第81-84页
    §4.2 Gittins指数策略的一个注解第84-90页
        §4.2.1 单个arm的Gittins指数过程第84-89页
        §4.2.2 Gittins指数策略第89-90页
    §4.3 本章小结第90-91页
第五章 不完全信息随机调度第91-105页
    §5.1 问题提出第91-92页
    §5.2 模型和预备知识第92-95页
        §5.2.1 模型建立第92-93页
        §5.2.2 预备知识第93-95页
    §5.3 静态策略第95-96页
    §5.4 限制性的动态策略第96-104页
    §5.5 本章小结第104-105页
结论第105-106页
参考文献第106-115页
致谢第115-116页
在学期间的研究成果及发表的论文第116页

论文共116页,点击 下载论文
上一篇:二硫化碳分子强场电离、双电离及核振动增强电离
下一篇:肿瘤血管生成和媒介传染病相关问题的建模与稳定性分析