基于连珠模式的六子棋机器博弈关键技术研究
摘要 | 第1-7页 |
Abstract | 第7-13页 |
第一章 绪论 | 第13-27页 |
·研究背景与动机 | 第13-15页 |
·国内外相关研究的现状与分析 | 第15-22页 |
·机器博弈研究的现状 | 第15-17页 |
·机器求解博弈问题的优势和劣势 | 第17-22页 |
·研究目标与意义 | 第22页 |
·本文工作 | 第22-27页 |
·研究内容 | 第23-24页 |
·论文的组织结构 | 第24-27页 |
第二章 相关理论基础 | 第27-49页 |
·机器博弈的研究对象和内容 | 第27-29页 |
·研究对象的分类 | 第27-28页 |
·本文的研究对象——k子棋 | 第28-29页 |
·机器博弈的基本概念和术语 | 第29-35页 |
·博弈树 | 第29-31页 |
·搜索树 | 第31-33页 |
·复杂性度量 | 第33页 |
·树与图 | 第33-35页 |
·基本的搜索技术及其原理 | 第35-47页 |
·极大极小策略和搜索 | 第35页 |
·α-β搜索 | 第35-37页 |
·(α,β)窗口 | 第37-39页 |
·深度优先的迭代加深搜索 | 第39-40页 |
·面向着法排序的启发式方法 | 第40-41页 |
·面向窗口的α-β搜索改进算法 | 第41-44页 |
·可变深度搜索 | 第44-47页 |
·本章小结 | 第47-49页 |
第三章 基于"连珠"模式的k子棋机器博弈模型 | 第49-85页 |
·引言 | 第49-51页 |
·连珠 | 第51-56页 |
·连珠的若干相关属性 | 第51-55页 |
·连珠的形式化表示 | 第55-56页 |
·连珠的估值 | 第56-65页 |
·连珠估值的二步法 | 第57-58页 |
·连珠的类型 | 第58-62页 |
·求解全部连珠类型的算法 | 第62-65页 |
·构造连珠知识库 | 第65页 |
·连珠之间的演化 | 第65-70页 |
·升变 | 第65-67页 |
·升变间的比较和连珠类型的抽象估值 | 第67-69页 |
·直接升变的简化 | 第69-70页 |
·降格 | 第70页 |
·空交叉点的价值 | 第70-75页 |
·空交叉点的价值 | 第70-74页 |
·空交叉点的复合类型 | 第74-75页 |
·模型的数据结构 | 第75-78页 |
·CPBIM模型 | 第75-76页 |
·潜在的连珠 | 第76-77页 |
·连珠和潜在连珠在局面中的形式化描述 | 第77-78页 |
·增量方法 | 第78-81页 |
·棋盘的基本操作 | 第78-79页 |
·增量的状态改变 | 第79页 |
·增量的状态恢复 | 第79-81页 |
·实验 | 第81-83页 |
·本章小结 | 第83-85页 |
第四章 求解博弈理论值为目标的搜索算法 | 第85-109页 |
·引言 | 第85-86页 |
·TSS搜索 | 第86-98页 |
·迫着的广泛性 | 第86-87页 |
·六子棋的TSS简介 | 第87-88页 |
·算法的形式化描述 | 第88-90页 |
·TSS的扩展——Anti-TSS策略 | 第90-91页 |
·DFID-TSS搜索算法 | 第91-95页 |
·实验 | 第95-98页 |
·PN搜索 | 第98-107页 |
·算法的非形式化描述 | 第99-102页 |
·阈值的改进 | 第102-104页 |
·实验 | 第104-105页 |
·结果和分析 | 第105-107页 |
·本章小结 | 第107-109页 |
第五章 面向机器博弈的TD学习算法研究 | 第109-121页 |
·引言 | 第109-110页 |
·TD(λ)学习 | 第110-111页 |
·估值函数 | 第111-114页 |
·手工调整参数 | 第111-112页 |
·权值调整自动化——BP神经元网络 | 第112-113页 |
·整合先验知识与神经元网络的估值函数 | 第113-114页 |
·自学习训练程序TDLConn6 | 第114-118页 |
·自学习训练方案 | 第115-116页 |
·训练集的生成 | 第116-117页 |
·可学习状态序列的截取 | 第117-118页 |
·实验 | 第118-119页 |
·"零知识"自学习训练 | 第118页 |
·先验知识引导的自学习训练 | 第118-119页 |
·学习效果分析 | 第119页 |
·本章小结 | 第119-121页 |
第六章 NEUConn6的设计与实现 | 第121-135页 |
·NEUConn6体系结构 | 第121-123页 |
·着法生成、排序和选择 | 第123-125页 |
·搜索算法 | 第125-126页 |
·估值函数 | 第126-130页 |
·基于局面的评估 | 第126-128页 |
·基于交叉点的评估 | 第128-130页 |
·开局库 | 第130-132页 |
·构造六子棋开局库 | 第130页 |
·影响开局库大小的因素 | 第130页 |
·开局库的存储方式和查询方式 | 第130-132页 |
·对称压缩 | 第132页 |
·时间控制 | 第132-134页 |
·时间分配策略的数学模型 | 第132-133页 |
·类Ponder技术 | 第133-134页 |
·本章小结 | 第134-135页 |
第七章 结束语 | 第135-139页 |
·本文的主要贡献与结论 | 第135-136页 |
·未来的工作 | 第136-139页 |
参考文献 | 第139-147页 |
致谢 | 第147-149页 |
攻博期间参加的科研项目 | 第149-151页 |
攻读博士期间发表的论著 | 第151-153页 |
附录A NEUConn6的竞赛成绩 | 第153-155页 |
附录B NEUConn6的版本更迭情况 | 第155-156页 |