基于强化学习理论的网络拥塞控制算法研究

摘要	第1-7页
英文摘要	第7-10页
目录	第10-13页
第1章绪论	第13-39页
·网络拥塞控制研究的意义	第13-17页
·网络拥塞控制的发展及研究概况	第17-33页
·ATM网络的ABR流量控制	第17-21页
·TCP网络的队列管理算法	第21-29页
·QoS路由管理算法	第29-33页
·强化学习研究概述	第33-37页
·本文主要工作	第37-39页
第2章基于模拟退火的分层强化学习ABR流量控制器的设计	第39-57页
·引言	第39-40页
·网络模型描述	第40-41页
·基于分层强化学习的ABR流量控制器的设计	第41-49页
·ABR流量控制器的结构	第41-42页
·AEN的设计与参数学习	第42-44页
·ASN的设计	第44-49页
·SAM的设计	第49页
·基于模拟退火的ASN参数学习	第49-52页
·系统仿真	第52-55页
·小结	第55-57页
第3章基于递归最小二乘的Q-学习多瓶颈ABR流量控制器的设计	第57-67页
·引言	第57-58页
·网络模型描述	第58-59页
·基于最小二乘的Q-学习流量控制器的设计	第59-64页
·控制器的设计	第59-63页
·基于递归最小二乘的控制器学习算法	第63-64页
·系统仿真	第64-66页
·小结	第66-67页
第4章基于Metropolis规则的Q-学习AQM控制器的设计	第67-89页
·引言	第67-68页
·基于Q-学习的AQM控制器的结构	第68-69页
·基于Q-学习的AQM控制器的设计	第69-74页
·基于Metropolis规则的动作选择策略	第74-77页
·状态空间变换	第77-79页
·多瓶颈链路Q-学习AQM控制器的设计	第79-81页
·系统仿真	第81-88页
·单瓶颈链路网络仿真	第81-83页
·多瓶颈链路网络仿真	第83-88页
·小结	第88-89页
第5章基于遗传算法的模糊Q-学习AQM控制器的设计	第89-107页
·引言	第89页
·模糊Q-学习方法研究	第89-92页
·AQM控制器的结构	第92-94页
·AQM控制器的设计	第94-97页
·基于遗传算法的参数寻优	第97-103页
·遗传算法的基本原理	第97-99页
·基于遗传算法的参数学习机制	第99-103页
·系统仿真	第103-106页
·小结	第106-107页
第6章基于价格机制的Nash Q-学习流量控制器的设计	第107-119页
·引言	第107页
·TCP的价格机制	第107-109页
·基于价格机制的奖赏函数设计	第109-112页
·Nash Q-学习流量控制器的设计	第112-116页
·系统仿真	第116-117页
·小结	第117-119页
第7章基于Q-学习的路由算法	第119-133页
·引言	第119-120页
·基于双度量的Q-Routing路由算法	第120-126页
·路由算法设计	第120-124页
·系统仿真	第124-126页
·基于记忆的Q-学习路由算法	第126-132页
·路由算法设计	第126-130页
·系统仿真	第130-132页
·小结	第132-133页
第8章结论与展望	第133-137页
参考文献	第137-149页
致谢	第149-151页
攻读博士学位期间所做的工作	第151-153页
作者简历	第153-155页