摘要 | 第1-4页 |
ABSTRACT | 第4-8页 |
1 绪论 | 第8-14页 |
·研究问题及研究意义 | 第8-9页 |
·国内外研究现状 | 第9-12页 |
·最优化条件的研究综述 | 第9-10页 |
·最优方程的研究综述 | 第10-11页 |
·折扣准则下的连续时间马尔可夫决策问题研究综述 | 第11-12页 |
·论文思路与研究内容 | 第12-14页 |
·研究思路 | 第12-13页 |
·研究内容 | 第13-14页 |
2 连续时间马尔可夫决策过程 | 第14-22页 |
·马尔可夫决策过程 | 第14-17页 |
·马尔可夫决策过程的定义与记号 | 第14-15页 |
·连续时间马尔可夫决策过程 | 第15-16页 |
·准则与策略 | 第16-17页 |
·连续时间马尔可夫决策模型 | 第17-19页 |
·折扣报酬最优准则 | 第17-18页 |
·转移速率 | 第18-19页 |
·建立决策模型 | 第19页 |
·马尔可夫策略 | 第19-22页 |
·平稳的马尔可夫策略 | 第20-21页 |
·最优策略 | 第21-22页 |
3 连续时间马尔可夫决策折扣报酬最优化条件 | 第22-27页 |
·系统历史数据处理 | 第22-24页 |
·转移速率的假设 | 第22-23页 |
·报酬率的假设 | 第23页 |
·最优值函数的假设 | 第23-24页 |
·两条引理 | 第24-27页 |
4 折扣准则下的连续时间马尔可夫决策最优方程及最优策略 | 第27-38页 |
·折扣准则下的连续时间马尔可夫最优方程 | 第27-34页 |
·策略迭代算法 | 第27页 |
·最优方程及证明 | 第27-34页 |
·折扣准则下的连续时间马尔可夫最优策略 | 第34-38页 |
·最优策略形式 | 第34页 |
·最优策略的性质 | 第34-38页 |
5 应用分析 | 第38-48页 |
·在电子商务中的一个应用 | 第38-45页 |
·问题的提出 | 第38页 |
·统计模型及转移率 | 第38-40页 |
·状态转移概率 | 第40-41页 |
·报酬函数的确定 | 第41-42页 |
·模型结论和数例分析 | 第42-45页 |
·其他应用 | 第45-48页 |
·空集装箱调配问题 | 第45-46页 |
·人力资源管理模型 | 第46-47页 |
·应用总结 | 第47-48页 |
致谢 | 第48-49页 |
参考文献 | 第49-52页 |
附录 | 第52页 |
作者在攻读学位期间发表的论文目录 | 第52页 |