基于层次MDP的对话管理系统研究与实现

摘要	第4-5页
ABSTRACT	第5页
第一章引言	第8-18页
1.1 研究背景与意义	第8-10页
1.2 对话管理建模	第10-16页
1.3 论文研究内容	第16页
1.4 论文的内容安排	第16-18页
第二章基础知识	第18-31页
2.1 MDP模型简介	第18-19页
2.2 MDP模型求解	第19-25页
2.2.1 值函数和Q函数	第19-21页
2.2.2 求解算法	第21-25页
2.2.3 复杂度分析	第25页
2.3 分层强化学习	第25-30页
2.3.1 SMDP	第26-27页
2.3.2 分层强化学习经典算法	第27-30页
2.4 本章小结	第30-31页
第三章 Tier-MDP模型	第31-37页
3.1 Tier-MDP模型简介	第31-32页
3.2 Tier-MDP中OutterMDP状态的建模	第32-33页
3.3 Tier-MDP算法流程	第33-35页
3.4 模型比较	第35-36页
3.5 本章小结	第36-37页
第四章基于Tier-MDP的对话管理	第37-45页
4.1 实验用例描述	第37页
4.2 Tier-MDP对话管理模型分析	第37-39页
4.2.1 分层和子任务分析	第37-38页
4.2.2 算法分析	第38-39页
4.3 Tier-MDP对话管理模型设计	第39-42页
4.3.1 InnerMDP	第40-41页
4.3.2 OutterMDP	第41-42页
4.4 策略分析	第42-44页
4.5 本章小结	第44-45页
第五章系统实现和实验分析	第45-56页
5.1 系统环境	第45-46页
5.2 实验及分析	第46-55页
5.2.1 实验	第46-54页
5.2.2 实验分析	第54-55页
5.4 本章总结	第55-56页
第六章总结与展望	第56-58页
6.1 本文工作总结	第56-57页
6.2 未来研究工作展望	第57-58页
参考文献	第58-61页
致谢	第61-62页
作者攻读学位期间发表的学术论文目录	第62页