首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

幻影围棋非完美信息机器博弈问题关键算法研究

摘要第5-6页
Abstract第6页
第1章 引言第10-16页
    1.1 研究背景第10-11页
    1.2 机器博弈历史与发展第11-12页
    1.3 本文贡献第12-13页
    1.4 组织结构第13-16页
第2章 机器博弈理论基础与相关算法介绍第16-30页
    2.1 机器博弈理论简介第16-18页
        2.1.1 博弈论相关概念简介第16-17页
        2.1.2 博弈论与机器博弈第17-18页
    2.2 机器博弈过程模型第18-20页
        2.2.1 拓展型博弈问题第18-19页
        2.2.2 完美信息拓展型博弈过程第19页
        2.2.3 非完美信息拓展型博弈过程第19-20页
    2.3 传统机器博弈基本算法第20-22页
        2.3.1 基于极大极小搜索算法第20-21页
        2.3.2 α-β剪枝搜索第21-22页
        2.3.3 负极大值算法第22页
    2.4 蒙特卡洛树搜索算法与UCT算法第22-24页
        2.4.1 蒙特卡洛树搜索方法第22-23页
        2.4.2 UCT算法第23-24页
    2.5 具有不完全信息的机器博弈算法第24-28页
        2.5.1 基于CFR的搜索算法第24-26页
        2.5.2 基于确定性融合的搜索算法第26-27页
        2.5.3 基于信息集的蒙特卡洛树搜索算法第27-28页
    2.6 本章总结第28-30页
第3章 基于信念状态的非完美信息博弈问题建模第30-36页
    3.1 非完美信息拓展型博弈问题第30-32页
        3.1.1 非完美信息拓展型博弈问题介绍第30-31页
        3.1.2 非完美信息拓展型博弈问题的复杂度第31-32页
    3.2 基于信念状态的非完美信息拓展型博弈问题模型第32-34页
        3.2.1 信念状态第32-33页
        3.2.2 非完美信息拓展型博弈问题建模第33-34页
    3.3 非拓展型博弈问题到非完美信息拓展型博弈问题的转化第34页
    3.4 本章小结第34-36页
第4章 信念状态-蒙特卡洛树搜索方法第36-42页
    4.1 信念状态树第36-37页
    4.2 传统的信念状态树搜索算法第37-38页
    4.3 基于蒙特卡洛方法的信念状态树搜索第38-39页
    4.4 信念状态-蒙特卡洛树搜索算法第39-41页
        4.4.1 信念状态-蒙特卡洛树搜索算法过程第39-41页
        4.4.2 探测和利用第41页
    4.5 本章小结第41-42页
第5章 基于对手模型的信念学习算法第42-54页
    5.1 对手模型的相关工作第42-43页
    5.2 参与者的信念第43-44页
    5.3 基于部分偏执的信念学习第44-47页
    5.4 基于随机最优反应估计的信念学习第47-52页
        5.4.1 随机最优反应估计第47页
        5.4.2 基于随机最优反应估计的对手猜测算法第47-50页
        5.4.3 基于随机最优反应估计的对手预测算法第50-52页
    5.5 本章小结第52-54页
第6章 搜索算法与信念学习方法在幻影围棋中的应用第54-64页
    6.1 幻影围棋博弈问题简介第54-55页
    6.2 幻影围棋博弈问题中信息的处理第55-57页
        6.2.1 幻影围棋博弈中的提子信息处理第55-56页
        6.2.2 幻影围棋博弈中的非法信息的处理第56-57页
    6.3 搜索算法与信念学习算法在幻影围棋中的应用第57-58页
        6.3.1 信念状态-蒙特卡洛树搜索算法在幻影围棋中的应用第57-58页
        6.3.2 信念学习算法在幻影围棋中的应用第58页
    6.4 幻影围棋博弈问题中搜索算法的改进方法第58-63页
        6.4.1 基于混合策略的信念状态-蒙特卡洛树搜索算法第59-60页
        6.4.2 基于AMAF启发的信念状态-蒙特卡洛树搜索算法第60-61页
        6.4.3 基于信息探测的信念状态-蒙特卡洛树搜索算法第61-63页
    6.5 本章小结第63-64页
第7章 基于幻影围棋的算法效果比较第64-76页
    7.1 基于一层蒙特卡洛树搜索算法的幻影围棋程序第64-65页
    7.2 信念状态-蒙特卡洛树搜索算法与信念学习算法的效果第65-71页
        7.2.1 信念学习算法的效果第65-66页
        7.2.2 历史采样的数量对算法效果的影响第66-68页
        7.2.3 搜索时间对算法效果的影响第68-69页
        7.2.4 历史采样与模拟棋局数最的平衡第69-71页
    7.3 基于幻影围棋特点的改进方法的效果第71-75页
        7.3.1 混合策略方法的效果第71-72页
        7.3.2 AMAF启发算法的效果第72-74页
        7.3.3 信息探测算法的效果第74-75页
    7.4 本章小结第75-76页
第8章 总结与展望第76-78页
    8.1 本文的主要贡献第76-77页
    8.2 进一步工作与展望第77-78页
参考文献第78-82页
致谢第82-84页
攻读硕士学位期间的论文项目情况第84页

论文共84页,点击 下载论文
上一篇:基于物联网的新城金矿井下生产调度管理系统研究
下一篇:仿人机器人步态规划与控制研究