首页--自然科学总论论文--系统科学论文--系统学、现代系统理论论文--大系统理论论文

基于梯度逼近方法的Markov系统及其在通信中的应用

摘要第1-8页
Abstract第8-14页
第一章 绪论第14-24页
   ·研究背景第14-20页
     ·性能优化问题的研究方法第14-16页
     ·基于灵敏度观点的优化第16-17页
     ·神经元动态规划第17-18页
     ·基于仿真的梯度逼近方法第18-19页
     ·自适应Markov报酬过程的研究意义第19页
     ·网络通信系统中的应用第19-20页
   ·本文的研究目的第20-21页
   ·本文的主要贡献与研究内容第21-24页
第二章 Markov决策过程基于灵敏度的性能优化第24-36页
   ·Markov决策过程与随机策略第24-29页
     ·离散时间和连续时间的Markov决策过程第24-25页
     ·随机策略第25-27页
     ·Markov决策过程的动态特性和优化准则第27-29页
   ·Markov决策过程的灵敏度分析第29-36页
     ·实现因子和性能势第29-30页
     ·性能势的估计第30-31页
     ·性能差与性能导数公式第31-32页
     ·性能梯度与基于梯度的优化第32-36页
第三章 自适应Markov报酬过程的基于灵敏度的性能分析第36-42页
   ·Markov报酬过程和自适应Markov报酬过程第36-38页
     ·Markov报酬过程第36-37页
     ·自适应Markov报酬过程第37-38页
   ·自适应Markov报酬过程的性能灵敏度分析与性能梯度的估计第38-40页
     ·性能灵敏度分析第38-39页
     ·性能梯度的估计第39-40页
   ·本章小结第40-42页
第四章 基于仿真的双时间尺度梯度逼近方法第42-88页
   ·传统的梯度逼近算法第42-44页
     ·再生环梯度逼近算法第42-43页
     ·每步梯度逼近算法第43-44页
   ·Markov报酬过程的双时间尺度梯度逼近算法第44-70页
     ·算法描述第44-46页
     ·收敛性分析第46-64页
     ·仿真第64-70页
   ·自适应Markov过程的双时间尺度梯度逼近算法第70-82页
     ·研究动机第71-74页
     ·未知参数的估计第74-75页
     ·双时间尺度梯度逼近算法第75-76页
     ·收敛性分析第76-79页
     ·仿真第79-82页
   ·随机策略的Markov决策过程的双时间尺度梯度逼近算法第82-86页
     ·性能梯度估计方差的降低第82-84页
     ·双时间尺度梯度逼近第84-86页
   ·本章小结第86-88页
第五章 双时间尺度梯度逼近算法在通信领域中的应用第88-100页
   ·OVSF-CDMA系统中动态编码分配的呼叫容许接入控制策略第88-92页
     ·研究动机第88-89页
     ·动态编码分配的呼叫容许接入控制和Markov决策过程第89-90页
     ·双时间尺度策略逼近呼叫容许接入控制算法第90-91页
     ·仿真第91-92页
   ·受限的OVSF-CDMA系统中动态编码分配的呼叫容许接入控制策略第92-99页
     ·问题描述第93-94页
     ·在线优化算法第94-97页
     ·仿真第97-99页
   ·结论第99-100页
第六章 总结与展望第100-102页
   ·总结第100-101页
   ·展望第101-102页
参考文献第102-108页
攻读博士学位期间的研究成果第108-109页
致谢第109页

论文共109页,点击 下载论文
上一篇:几种基本构件的冲击相变响应的数值模拟研究
下一篇:血流动力学数值计算与模拟