基于梯度逼近方法的Markov系统及其在通信中的应用

摘要	第1-8页
Abstract	第8-14页
第一章绪论	第14-24页
·研究背景	第14-20页
·性能优化问题的研究方法	第14-16页
·基于灵敏度观点的优化	第16-17页
·神经元动态规划	第17-18页
·基于仿真的梯度逼近方法	第18-19页
·自适应Markov报酬过程的研究意义	第19页
·网络通信系统中的应用	第19-20页
·本文的研究目的	第20-21页
·本文的主要贡献与研究内容	第21-24页
第二章 Markov决策过程基于灵敏度的性能优化	第24-36页
·Markov决策过程与随机策略	第24-29页
·离散时间和连续时间的Markov决策过程	第24-25页
·随机策略	第25-27页
·Markov决策过程的动态特性和优化准则	第27-29页
·Markov决策过程的灵敏度分析	第29-36页
·实现因子和性能势	第29-30页
·性能势的估计	第30-31页
·性能差与性能导数公式	第31-32页
·性能梯度与基于梯度的优化	第32-36页
第三章自适应Markov报酬过程的基于灵敏度的性能分析	第36-42页
·Markov报酬过程和自适应Markov报酬过程	第36-38页
·Markov报酬过程	第36-37页
·自适应Markov报酬过程	第37-38页
·自适应Markov报酬过程的性能灵敏度分析与性能梯度的估计	第38-40页
·性能灵敏度分析	第38-39页
·性能梯度的估计	第39-40页
·本章小结	第40-42页
第四章基于仿真的双时间尺度梯度逼近方法	第42-88页
·传统的梯度逼近算法	第42-44页
·再生环梯度逼近算法	第42-43页
·每步梯度逼近算法	第43-44页
·Markov报酬过程的双时间尺度梯度逼近算法	第44-70页
·算法描述	第44-46页
·收敛性分析	第46-64页
·仿真	第64-70页
·自适应Markov过程的双时间尺度梯度逼近算法	第70-82页
·研究动机	第71-74页
·未知参数的估计	第74-75页
·双时间尺度梯度逼近算法	第75-76页
·收敛性分析	第76-79页
·仿真	第79-82页
·随机策略的Markov决策过程的双时间尺度梯度逼近算法	第82-86页
·性能梯度估计方差的降低	第82-84页
·双时间尺度梯度逼近	第84-86页
·本章小结	第86-88页
第五章双时间尺度梯度逼近算法在通信领域中的应用	第88-100页
·OVSF-CDMA系统中动态编码分配的呼叫容许接入控制策略	第88-92页
·研究动机	第88-89页
·动态编码分配的呼叫容许接入控制和Markov决策过程	第89-90页
·双时间尺度策略逼近呼叫容许接入控制算法	第90-91页
·仿真	第91-92页
·受限的OVSF-CDMA系统中动态编码分配的呼叫容许接入控制策略	第92-99页
·问题描述	第93-94页
·在线优化算法	第94-97页
·仿真	第97-99页
·结论	第99-100页
第六章总结与展望	第100-102页
·总结	第100-101页
·展望	第101-102页
参考文献	第102-108页
攻读博士学位期间的研究成果	第108-109页
致谢	第109页