基于激励学习的人机口语对话策略优化

摘要	第1-5页
ABSTRACT	第5-8页
第1章绪论	第8-12页
·课题背景和研究意义	第8页
·口语对话系统的发展	第8-9页
·口语对话系统的主要应用形式和方向	第9-10页
·国内国际研究现状	第10-11页
·本文所做的工作	第11-12页
第2章理论基础	第12-24页
·口语对话系统的基本逻辑层次	第12页
·口语对话系统的基本系统组成	第12-18页
·语音识别单元	第13-15页
·对话管理单元	第15-17页
·语音合成单元与数据库	第17-18页
·激励学习简介	第18-22页
·激励学习历史沿革	第18-19页
·激励学习基本模型	第19-21页
·激励学习简单示例	第21页
·激励学习基本算法	第21-22页
·本章小结	第22-24页
第3章 RL-SDS模型的建立	第24-32页
·使用激励学习产生和优化对话策略	第24-25页
·使用激励学习为对话策略管理建模的可行性	第24-25页
·模型中主要应包涵的内容	第25页
·Singh的模型介绍	第25-26页
·Walker的模型简介	第26-27页
·RL-SDS模型	第27-31页
·对话过程在模型中的约简	第27-28页
·模型中的状态离散化	第28页
·模型中的状态表示	第28-29页
·模型中的动作表示	第29-30页
·模型中的 MDP	第30页
·RL-SDS模型的实现步骤	第30-31页
·RL-SDS模型与Singh和Walker模型的比较	第31页
·本章小结	第31-32页
第4章 RL-SDS模型在特定任务领域中的应用	第32-42页
·特定任务领域对话环境下的状态	第32-33页
·特定任务领域对话环境下的动作	第33页
·特定任务领域对话环境下的奖赏和折扣	第33-34页
·模型在特定任务领域对话环境下的复杂度	第34-36页
·RL-SDS模型的实现	第36-39页
·与Singh模型的比较	第39-40页
·本章小结	第40-42页
第5章 RL-SDS模型在心理咨询系统中的应用	第42-48页
·心理咨询系统的状态和动作	第42-43页
·心理咨询系统的奖赏确定	第43-44页
·心理咨询系统中RL-SDS模型的实现	第44-45页
·系统的训练结果	第45-47页
·本章小结	第47-48页
结论与展望	第48-50页
参考文献	第50-53页
致谢	第53-54页
附录 A 攻读学位期间发表的学术论文	第54-55页
附录 B 攻读硕士学位期间参与研究的科研项目	第55页