首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于连珠模式的六子棋机器博弈关键技术研究

摘要第1-7页
Abstract第7-13页
第一章 绪论第13-27页
   ·研究背景与动机第13-15页
   ·国内外相关研究的现状与分析第15-22页
     ·机器博弈研究的现状第15-17页
     ·机器求解博弈问题的优势和劣势第17-22页
   ·研究目标与意义第22页
   ·本文工作第22-27页
     ·研究内容第23-24页
     ·论文的组织结构第24-27页
第二章 相关理论基础第27-49页
   ·机器博弈的研究对象和内容第27-29页
     ·研究对象的分类第27-28页
     ·本文的研究对象——k子棋第28-29页
   ·机器博弈的基本概念和术语第29-35页
     ·博弈树第29-31页
     ·搜索树第31-33页
     ·复杂性度量第33页
     ·树与图第33-35页
   ·基本的搜索技术及其原理第35-47页
     ·极大极小策略和搜索第35页
     ·α-β搜索第35-37页
     ·(α,β)窗口第37-39页
     ·深度优先的迭代加深搜索第39-40页
     ·面向着法排序的启发式方法第40-41页
     ·面向窗口的α-β搜索改进算法第41-44页
     ·可变深度搜索第44-47页
   ·本章小结第47-49页
第三章 基于"连珠"模式的k子棋机器博弈模型第49-85页
   ·引言第49-51页
   ·连珠第51-56页
     ·连珠的若干相关属性第51-55页
     ·连珠的形式化表示第55-56页
   ·连珠的估值第56-65页
     ·连珠估值的二步法第57-58页
     ·连珠的类型第58-62页
     ·求解全部连珠类型的算法第62-65页
     ·构造连珠知识库第65页
   ·连珠之间的演化第65-70页
     ·升变第65-67页
     ·升变间的比较和连珠类型的抽象估值第67-69页
     ·直接升变的简化第69-70页
     ·降格第70页
   ·空交叉点的价值第70-75页
     ·空交叉点的价值第70-74页
     ·空交叉点的复合类型第74-75页
   ·模型的数据结构第75-78页
     ·CPBIM模型第75-76页
     ·潜在的连珠第76-77页
     ·连珠和潜在连珠在局面中的形式化描述第77-78页
   ·增量方法第78-81页
     ·棋盘的基本操作第78-79页
     ·增量的状态改变第79页
     ·增量的状态恢复第79-81页
   ·实验第81-83页
   ·本章小结第83-85页
第四章 求解博弈理论值为目标的搜索算法第85-109页
   ·引言第85-86页
   ·TSS搜索第86-98页
     ·迫着的广泛性第86-87页
     ·六子棋的TSS简介第87-88页
     ·算法的形式化描述第88-90页
     ·TSS的扩展——Anti-TSS策略第90-91页
     ·DFID-TSS搜索算法第91-95页
     ·实验第95-98页
   ·PN搜索第98-107页
     ·算法的非形式化描述第99-102页
     ·阈值的改进第102-104页
     ·实验第104-105页
     ·结果和分析第105-107页
   ·本章小结第107-109页
第五章 面向机器博弈的TD学习算法研究第109-121页
   ·引言第109-110页
   ·TD(λ)学习第110-111页
   ·估值函数第111-114页
     ·手工调整参数第111-112页
     ·权值调整自动化——BP神经元网络第112-113页
     ·整合先验知识与神经元网络的估值函数第113-114页
   ·自学习训练程序TDLConn6第114-118页
     ·自学习训练方案第115-116页
     ·训练集的生成第116-117页
     ·可学习状态序列的截取第117-118页
   ·实验第118-119页
     ·"零知识"自学习训练第118页
     ·先验知识引导的自学习训练第118-119页
     ·学习效果分析第119页
   ·本章小结第119-121页
第六章 NEUConn6的设计与实现第121-135页
   ·NEUConn6体系结构第121-123页
   ·着法生成、排序和选择第123-125页
   ·搜索算法第125-126页
   ·估值函数第126-130页
     ·基于局面的评估第126-128页
     ·基于交叉点的评估第128-130页
   ·开局库第130-132页
     ·构造六子棋开局库第130页
     ·影响开局库大小的因素第130页
     ·开局库的存储方式和查询方式第130-132页
     ·对称压缩第132页
   ·时间控制第132-134页
     ·时间分配策略的数学模型第132-133页
     ·类Ponder技术第133-134页
   ·本章小结第134-135页
第七章 结束语第135-139页
   ·本文的主要贡献与结论第135-136页
   ·未来的工作第136-139页
参考文献第139-147页
致谢第147-149页
攻博期间参加的科研项目第149-151页
攻读博士期间发表的论著第151-153页
附录A NEUConn6的竞赛成绩第153-155页
附录B NEUConn6的版本更迭情况第155-156页

论文共156页,点击 下载论文
上一篇:一类非线性系统的神经网络控制及其在机械手系统的应用
下一篇:不完全信息下的综合评价方法研究