| 摘要 | 第1-4页 |
| ABSTRACT | 第4-8页 |
| 1 绪论 | 第8-14页 |
| ·研究问题及研究意义 | 第8-9页 |
| ·国内外研究现状 | 第9-12页 |
| ·最优化条件的研究综述 | 第9-10页 |
| ·最优方程的研究综述 | 第10-11页 |
| ·折扣准则下的连续时间马尔可夫决策问题研究综述 | 第11-12页 |
| ·论文思路与研究内容 | 第12-14页 |
| ·研究思路 | 第12-13页 |
| ·研究内容 | 第13-14页 |
| 2 连续时间马尔可夫决策过程 | 第14-22页 |
| ·马尔可夫决策过程 | 第14-17页 |
| ·马尔可夫决策过程的定义与记号 | 第14-15页 |
| ·连续时间马尔可夫决策过程 | 第15-16页 |
| ·准则与策略 | 第16-17页 |
| ·连续时间马尔可夫决策模型 | 第17-19页 |
| ·折扣报酬最优准则 | 第17-18页 |
| ·转移速率 | 第18-19页 |
| ·建立决策模型 | 第19页 |
| ·马尔可夫策略 | 第19-22页 |
| ·平稳的马尔可夫策略 | 第20-21页 |
| ·最优策略 | 第21-22页 |
| 3 连续时间马尔可夫决策折扣报酬最优化条件 | 第22-27页 |
| ·系统历史数据处理 | 第22-24页 |
| ·转移速率的假设 | 第22-23页 |
| ·报酬率的假设 | 第23页 |
| ·最优值函数的假设 | 第23-24页 |
| ·两条引理 | 第24-27页 |
| 4 折扣准则下的连续时间马尔可夫决策最优方程及最优策略 | 第27-38页 |
| ·折扣准则下的连续时间马尔可夫最优方程 | 第27-34页 |
| ·策略迭代算法 | 第27页 |
| ·最优方程及证明 | 第27-34页 |
| ·折扣准则下的连续时间马尔可夫最优策略 | 第34-38页 |
| ·最优策略形式 | 第34页 |
| ·最优策略的性质 | 第34-38页 |
| 5 应用分析 | 第38-48页 |
| ·在电子商务中的一个应用 | 第38-45页 |
| ·问题的提出 | 第38页 |
| ·统计模型及转移率 | 第38-40页 |
| ·状态转移概率 | 第40-41页 |
| ·报酬函数的确定 | 第41-42页 |
| ·模型结论和数例分析 | 第42-45页 |
| ·其他应用 | 第45-48页 |
| ·空集装箱调配问题 | 第45-46页 |
| ·人力资源管理模型 | 第46-47页 |
| ·应用总结 | 第47-48页 |
| 致谢 | 第48-49页 |
| 参考文献 | 第49-52页 |
| 附录 | 第52页 |
| 作者在攻读学位期间发表的论文目录 | 第52页 |