首页--数理科学和化学论文--概率论与数理统计论文--概率论(几率论、或然率论)论文

Erlang(k) Bandit抽样过程

摘要第1-5页
ABSTRACT第5-9页
第一章 绪论第9-18页
   ·经典 Bandit模型及应用第9-10页
   ·经典 Bandit模型的扩展第10-13页
   ·Bandit模型的计算第13-16页
     ·动态规划第13-14页
     ·特殊策略的最优性第14-15页
     ·Gittins指数策略第15-16页
   ·论文的主要研究内容第16-18页
第二章 Bandit过程的预备知识第18-26页
   ·马氏决策过程第18-21页
     ·马氏决策过程的定义和分类第18页
     ·离散时间马氏决策过程和半马氏决策过程第18-21页
   ·Bandit过程和Gittins指数定理第21-24页
     ·Bandit过程和 Bandit过程族第21-23页
     ·Gittins指数定理第23-24页
   ·折扣序列第24-26页
第三章 Bandit抽样过程的性质和方法第26-33页
   ·Bandit抽样过程和贝叶斯方法第26-29页
     ·Bandit抽样过程的定义和分类第26页
     ·贝叶斯方法第26-28页
     ·Bandit抽样过程的基本原理第28-29页
   ·几类特殊 Bandit抽样过程的性质第29-31页
     ·Erlang(k) Bandit报酬过程第29-30页
     ·Erlang(2) Bandit目标过程第30页
     ·考虑抽样时间间隔的特殊 Bandit报酬过程第30-31页
   ·报酬过程 Gittins指数的渐进性质第31-33页
第四章 Bandit抽样过程的模型和计算第33-48页
   ·校正方法第33-36页
     ·校正方法的基本原理第33-34页
     ·校正方法的简化第34-36页
   ·Erlang(k)Bandit报酬过程的最优决策问题第36-39页
     ·基本模型第36-37页
     ·计算最优平衡值∑_n~((k))的算法第37-38页
     ·Gittins指数和 ∑_n~((k))的渐近性质第38-39页
   ·Erlang(2) Bandit目标过程的最优决策问题第39-42页
     ·基本模型第39-40页
     ·计算最优平衡值 ∑_n的算法第40-42页
   ·考虑抽样时间间隔的特殊 Bandit报酬过程的最优决策问题第42-48页
     ·基本模型第42-43页
     ·Gittins指数的单调性质第43-44页
     ·计算最优停止时间的算法第44-48页
结论第48-49页
参考文献第49-56页
致谢第56-57页
攻读学位期间主要的研究成果第57页

论文共57页,点击 下载论文
上一篇:初教六型飞机仿真中的数据采集处理及控制系统
下一篇:核内M-CSF对Cos7细胞增殖的影响及其靶分子的鉴定