摘要 | 第4-6页 |
abstract | 第6-8页 |
主要符号对照表 | 第18-19页 |
缩略语对照表 | 第19-20页 |
第一章 绪论 | 第20-30页 |
1.1 研究背景和意义 | 第20-21页 |
1.2 国内外研究现状 | 第21-25页 |
1.3 论文的研究内容 | 第25-27页 |
1.4 论文的组织结构与各研究内容间的关系 | 第27-30页 |
第二章 相关基础知识 | 第30-48页 |
2.1 学习自动机数学模型及学习框架 | 第30-34页 |
2.1.1 随机环境 | 第31-32页 |
2.1.2 学习自动机 | 第32-34页 |
2.2 经典VSSA算法介绍 | 第34-43页 |
2.2.1 Linear系列算法 | 第34-36页 |
2.2.2 Pursuit算法 | 第36-37页 |
2.2.3 DGPA算法 | 第37-39页 |
2.2.4 SERI算法 | 第39-40页 |
2.2.5 LELA算法 | 第40-43页 |
2.3 学习自动机性能评价 | 第43-47页 |
2.3.1 评价指标 | 第43-44页 |
2.3.2 评价方法 | 第44-47页 |
2.4 本章小结 | 第47-48页 |
第三章 基于置信区间估计器的学习自动机 | 第48-72页 |
3.1 引言 | 第48页 |
3.2 现有最大似然估计器算法局限性分析 | 第48-50页 |
3.2.1 基本概念 | 第49页 |
3.2.2 确定性最大似然估计器 | 第49-50页 |
3.2.3 随机性最大似然估计器 | 第50页 |
3.3 确定性置信区间估计器设计 | 第50-52页 |
3.4 基于确定性置信区间估计器的学习自动机 | 第52-59页 |
3.4.1 算法框架 | 第52页 |
3.4.2 收敛性证明 | 第52-55页 |
3.4.3 仿真实验 | 第55-59页 |
3.5 随机性置信区间估计器的设计 | 第59-61页 |
3.5.1 点随机估计器 | 第60-61页 |
3.5.2 区间随机估计器 | 第61页 |
3.6 基于随机性置信区间估计器的学习自动机 | 第61-70页 |
3.6.1 算法框架 | 第61-62页 |
3.6.2 收敛性证明 | 第62-63页 |
3.6.3 仿真实验 | 第63-70页 |
3.7 本章小结 | 第70-72页 |
第四章 参数免调节的学习自动机 | 第72-104页 |
4.1 引言 | 第72页 |
4.2 现有学习自动机参数设置分析 | 第72-75页 |
4.2.1 学习自动机参数设置与性能的关系 | 第72-75页 |
4.2.2 参数调整的步骤与机制缺陷 | 第75页 |
4.3 参数免调节学习自动机设计思路 | 第75-78页 |
4.3.1 现有算法局限性分析 | 第75-77页 |
4.3.2 参数免调节学习自动机架构模型 | 第77-78页 |
4.4 两行为环境中的参数免调节学习自动机 | 第78-83页 |
4.4.1 两行为环境中的贝叶斯收敛判断 | 第79页 |
4.4.2 两行为环境中的优化采样策略 | 第79-81页 |
4.4.3 两行为环境中的参数免调节学习自动机算法 | 第81页 |
4.4.4 性能分析及收敛性证明 | 第81-82页 |
4.4.5 仿真实验 | 第82-83页 |
4.5 两行为环境的参数免调节学习自动机加速方法 | 第83-88页 |
4.5.1 循环关系式法 | 第84-85页 |
4.5.2 正态分布近似法 | 第85-86页 |
4.5.3 性能分析及收敛性证明 | 第86-87页 |
4.5.4 仿真实验 | 第87-88页 |
4.6 多行为环境中的参数免调节学习自动机 | 第88-102页 |
4.6.1 多行为环境中的贝叶斯收敛判断 | 第89页 |
4.6.2 多行为环境中的优化采样策略 | 第89-90页 |
4.6.3 多行为环境中的参数免调节学习自动机算法 | 第90-91页 |
4.6.4 性能分析及收敛性证明 | 第91-98页 |
4.6.5 仿真实验 | 第98-102页 |
4.7 本章小结 | 第102-104页 |
第五章 基于估计器的学习自动机的并行化 | 第104-136页 |
5.1 引言 | 第104页 |
5.2 现有并行化算法/方案的分析 | 第104-108页 |
5.2.1 经典并行化Pursuit算法 | 第105-106页 |
5.2.2 分散式学习并行化方案 | 第106-108页 |
5.3 基于置信区间估计的并行式改进方案 | 第108-126页 |
5.3.1 方案描述 | 第108-109页 |
5.3.2 收敛性证明 | 第109-111页 |
5.3.3 仿真实验 | 第111-126页 |
5.4 参数免调节学习自动机的并行化算法 | 第126-134页 |
5.4.1 算法描述 | 第126-129页 |
5.4.2 收敛性证明 | 第129-132页 |
5.4.3 仿真实验 | 第132-134页 |
5.5 本章小结 | 第134-136页 |
第六章 学习自动机在信息传播最大化问题中的应用 | 第136-160页 |
6.1 引言 | 第136-137页 |
6.2 基础知识 | 第137-142页 |
6.2.1 信息传播模型 | 第137-138页 |
6.2.2 信息传播最大化定义及研究现状 | 第138-142页 |
6.3 基于学习自动机的信息传播最大化方法 | 第142-148页 |
6.3.1 IMLA方法 | 第142-147页 |
6.3.2 两种IMLA方法变体 | 第147-148页 |
6.4 实验仿真与分析 | 第148-158页 |
6.4.1 实验数据集 | 第148页 |
6.4.2 基准参照算法 | 第148-149页 |
6.4.3 参数设置 | 第149-150页 |
6.4.4 实验结果 | 第150-158页 |
6.5 本章小结 | 第158-160页 |
第七章 总结与展望 | 第160-164页 |
7.1 全文总结 | 第160-161页 |
7.2 未来研究展望 | 第161-164页 |
参考文献 | 第164-178页 |
致谢 | 第178-180页 |
攻读学位期间发表的学术论文 | 第180-182页 |
攻读学位期间申请的专利 | 第182页 |