首页--社会科学总论论文--管理学论文--决策学论文

信息的价值在马尔可夫决策理论下的应用

摘要第5-6页
abstract第6-7页
第一章 绪论第11-18页
    1.1 研究工作的背景与意义第11-13页
        1.1.1 研究背景第11-12页
        1.1.2 研究意义第12-13页
    1.2 研究现状第13-16页
        1.2.1 马尔可夫决策理论第13-14页
        1.2.2 信息的价值及其计算第14-16页
    1.3 本文的主要工作第16-17页
    1.4 论文结构第17-18页
第二章 研究相关技术基础第18-35页
    2.1 决策问题中的动态决策理论第18-20页
        2.1.1 动态规划理论第18-19页
        2.1.2 马尔可夫过程理论第19-20页
    2.2 马尔可夫决策过程第20-24页
        2.2.1 模型定义第20-21页
        2.2.2 策略及值函数第21-22页
        2.2.3 马尔可夫决策过程求解方法第22-24页
    2.3 部分可观察马尔可夫决策过程第24-31页
        2.3.1 模型定义第24-25页
        2.3.2 策略及求解第25-28页
        2.3.3 在线规划算法第28-29页
        2.3.4 蒙特卡洛方法第29-31页
    2.4 马尔可夫决策理论中的信息的价值第31-34页
        2.4.1 POMDP中的完美信息期望值第32-34页
        2.4.2 VOI顺序规律第34页
    2.5 本章小结第34-35页
第三章 基于信念的价值决策模型及其应用第35-57页
    3.1 Belief-VOI应用分析第35-36页
    3.2 信念状态MDP第36-39页
        3.2.1 不确定性序贯决策问题分析第36-38页
        3.2.2 基于信念状态的建模理论第38-39页
    3.3 基于马尔可夫链的最优停止第39-41页
        3.3.1 最优停止问题分析第39页
        3.3.2 最优解的存在性证明第39-41页
    3.4 Belief-VOI建模第41-45页
        3.4.1 模型定义第42-43页
        3.4.2 模型描述第43-45页
    3.5 Belief-VOI在众包质量控制中的应用第45-56页
        3.5.1 问题描述第45-49页
        3.5.2 模型的创建第49-56页
    3.6 本章小结第56-57页
第四章 一种改进的蒙特卡洛方法计算信息的价值第57-68页
    4.1 求解的复杂度分析第57-58页
    4.2 传统蒙特卡洛方法缺点第58-61页
        4.2.1 UCT方法第58-60页
        4.2.2 蒙特卡洛树搜索第60-61页
    4.3 改进的蒙特卡洛方法计算信息的价值第61-67页
        4.3.1 问题限制第61-62页
        4.3.2 算法描述第62-66页
        4.3.3 一个例子第66-67页
    4.4 本章小结第67-68页
第五章 实验与分析第68-74页
    5.1 实验配置第68页
    5.2 实验准备工作第68-69页
    5.3 实验结果对比与分析第69-73页
        5.3.1 模型的验证第69-70页
        5.3.2 与传统蒙特卡洛方法的对比第70-72页
        5.3.3 BMCT运行性能第72-73页
    5.4 本章小结第73-74页
第六章 总结与展望第74-76页
    6.1 已完成的工作第74-75页
    6.2 下一步研究方向第75-76页
致谢第76-77页
参考文献第77-82页
攻读硕士期间取得的成果第82页

论文共82页,点击 下载论文
上一篇:S市供电公司OLM系统建设项目成本与风险管理研究
下一篇:学术诚信及其失范问题研究