基于连珠模式的六子棋机器博弈关键技术研究
| 摘要 | 第1-7页 |
| Abstract | 第7-13页 |
| 第一章 绪论 | 第13-27页 |
| ·研究背景与动机 | 第13-15页 |
| ·国内外相关研究的现状与分析 | 第15-22页 |
| ·机器博弈研究的现状 | 第15-17页 |
| ·机器求解博弈问题的优势和劣势 | 第17-22页 |
| ·研究目标与意义 | 第22页 |
| ·本文工作 | 第22-27页 |
| ·研究内容 | 第23-24页 |
| ·论文的组织结构 | 第24-27页 |
| 第二章 相关理论基础 | 第27-49页 |
| ·机器博弈的研究对象和内容 | 第27-29页 |
| ·研究对象的分类 | 第27-28页 |
| ·本文的研究对象——k子棋 | 第28-29页 |
| ·机器博弈的基本概念和术语 | 第29-35页 |
| ·博弈树 | 第29-31页 |
| ·搜索树 | 第31-33页 |
| ·复杂性度量 | 第33页 |
| ·树与图 | 第33-35页 |
| ·基本的搜索技术及其原理 | 第35-47页 |
| ·极大极小策略和搜索 | 第35页 |
| ·α-β搜索 | 第35-37页 |
| ·(α,β)窗口 | 第37-39页 |
| ·深度优先的迭代加深搜索 | 第39-40页 |
| ·面向着法排序的启发式方法 | 第40-41页 |
| ·面向窗口的α-β搜索改进算法 | 第41-44页 |
| ·可变深度搜索 | 第44-47页 |
| ·本章小结 | 第47-49页 |
| 第三章 基于"连珠"模式的k子棋机器博弈模型 | 第49-85页 |
| ·引言 | 第49-51页 |
| ·连珠 | 第51-56页 |
| ·连珠的若干相关属性 | 第51-55页 |
| ·连珠的形式化表示 | 第55-56页 |
| ·连珠的估值 | 第56-65页 |
| ·连珠估值的二步法 | 第57-58页 |
| ·连珠的类型 | 第58-62页 |
| ·求解全部连珠类型的算法 | 第62-65页 |
| ·构造连珠知识库 | 第65页 |
| ·连珠之间的演化 | 第65-70页 |
| ·升变 | 第65-67页 |
| ·升变间的比较和连珠类型的抽象估值 | 第67-69页 |
| ·直接升变的简化 | 第69-70页 |
| ·降格 | 第70页 |
| ·空交叉点的价值 | 第70-75页 |
| ·空交叉点的价值 | 第70-74页 |
| ·空交叉点的复合类型 | 第74-75页 |
| ·模型的数据结构 | 第75-78页 |
| ·CPBIM模型 | 第75-76页 |
| ·潜在的连珠 | 第76-77页 |
| ·连珠和潜在连珠在局面中的形式化描述 | 第77-78页 |
| ·增量方法 | 第78-81页 |
| ·棋盘的基本操作 | 第78-79页 |
| ·增量的状态改变 | 第79页 |
| ·增量的状态恢复 | 第79-81页 |
| ·实验 | 第81-83页 |
| ·本章小结 | 第83-85页 |
| 第四章 求解博弈理论值为目标的搜索算法 | 第85-109页 |
| ·引言 | 第85-86页 |
| ·TSS搜索 | 第86-98页 |
| ·迫着的广泛性 | 第86-87页 |
| ·六子棋的TSS简介 | 第87-88页 |
| ·算法的形式化描述 | 第88-90页 |
| ·TSS的扩展——Anti-TSS策略 | 第90-91页 |
| ·DFID-TSS搜索算法 | 第91-95页 |
| ·实验 | 第95-98页 |
| ·PN搜索 | 第98-107页 |
| ·算法的非形式化描述 | 第99-102页 |
| ·阈值的改进 | 第102-104页 |
| ·实验 | 第104-105页 |
| ·结果和分析 | 第105-107页 |
| ·本章小结 | 第107-109页 |
| 第五章 面向机器博弈的TD学习算法研究 | 第109-121页 |
| ·引言 | 第109-110页 |
| ·TD(λ)学习 | 第110-111页 |
| ·估值函数 | 第111-114页 |
| ·手工调整参数 | 第111-112页 |
| ·权值调整自动化——BP神经元网络 | 第112-113页 |
| ·整合先验知识与神经元网络的估值函数 | 第113-114页 |
| ·自学习训练程序TDLConn6 | 第114-118页 |
| ·自学习训练方案 | 第115-116页 |
| ·训练集的生成 | 第116-117页 |
| ·可学习状态序列的截取 | 第117-118页 |
| ·实验 | 第118-119页 |
| ·"零知识"自学习训练 | 第118页 |
| ·先验知识引导的自学习训练 | 第118-119页 |
| ·学习效果分析 | 第119页 |
| ·本章小结 | 第119-121页 |
| 第六章 NEUConn6的设计与实现 | 第121-135页 |
| ·NEUConn6体系结构 | 第121-123页 |
| ·着法生成、排序和选择 | 第123-125页 |
| ·搜索算法 | 第125-126页 |
| ·估值函数 | 第126-130页 |
| ·基于局面的评估 | 第126-128页 |
| ·基于交叉点的评估 | 第128-130页 |
| ·开局库 | 第130-132页 |
| ·构造六子棋开局库 | 第130页 |
| ·影响开局库大小的因素 | 第130页 |
| ·开局库的存储方式和查询方式 | 第130-132页 |
| ·对称压缩 | 第132页 |
| ·时间控制 | 第132-134页 |
| ·时间分配策略的数学模型 | 第132-133页 |
| ·类Ponder技术 | 第133-134页 |
| ·本章小结 | 第134-135页 |
| 第七章 结束语 | 第135-139页 |
| ·本文的主要贡献与结论 | 第135-136页 |
| ·未来的工作 | 第136-139页 |
| 参考文献 | 第139-147页 |
| 致谢 | 第147-149页 |
| 攻博期间参加的科研项目 | 第149-151页 |
| 攻读博士期间发表的论著 | 第151-153页 |
| 附录A NEUConn6的竞赛成绩 | 第153-155页 |
| 附录B NEUConn6的版本更迭情况 | 第155-156页 |