离散时间马氏过程的最优控制——新的最优性条件和新的方法

中文摘要	第1-5页
英文摘要	第5-8页
目录	第8-11页
第一章综述	第11-30页
·马尔可夫决策过程的历史背景	第11-13页
·离散时间MDP模型	第13-14页
·策略的几个基本定义及其上的概率空间构造	第14-15页
·常用的几个最优性准则	第15-18页
·国内外DTMDP的研究现状	第18-27页
·本文的主要工作	第27-30页
第二章 DTMDP的上极限和下极限平均准则	第30-44页
·引言	第30-31页
·模型, 概念及定义	第31-32页
·最优性条件及技术引理	第32-36页
·平均费用最优平稳策略的存在性	第36-40页
·例子	第40-43页
·本章结束语	第43-44页
第三章 Borel空间的DTMDP平均最优性问题	第44-60页
·引言	第44-45页
·最优控制问题	第45-46页
·最优性条件	第46-51页
·平均最优平稳策略的存在性	第51-54页
·平均最优平稳策略的半鞅刻划	第54-56页
·例子	第56-59页
·本章结束语	第59-60页
第四章 Borel空间的DTMDP平均期望费用的值迭代算法	第60-70页
·引言	第60-61页
·最优控制问题	第61-62页
·平均费用最优过程	第62-65页
·值迭代算法	第65-69页
·本章结束语	第69-70页
第五章 Borel空间DTMDP的平均样本轨道最优	第70-84页
·引言	第70-71页
·最优控制问题	第71-72页
·最优性条件	第72-76页
·平均样本轨道费用最优平稳策略的存在性	第76-81页
·例子	第81-83页
·本章结束语	第83-84页
第六章 Borel空间DTMDP的方差最优	第84-95页
·引言	第84-85页
·最优控制问题	第85-86页
·最优性条件	第86-89页
·方差最小	第89-92页
·例子	第92-94页
·本章结束语	第94-95页
第七章 Borel空间DTMDP的强n(n =-1,0)-折扣最优	第95-110页
·引言	第95-96页
·最优控制问题	第96-97页
·最优性条件及引理	第97-103页
·主要结果	第103-105页
·例子	第105-109页
·本章结束语	第109-110页
参考文献	第110-128页
博士期间发表和完成的论文	第128-130页
致谢	第130-131页
原创声明	第131页