模型自由的离散时间系统的随机线性二次最优控制

2016年 36卷 第No.6期
阅读:60
查看详情
关键词: Q 学习算法, 值函数, 随机线性二次最优控制, 随机代数方程
Q 学习算法; 值函数; 随机线性二次最优控制; 随机代数方程;
教育部基本科研业务项目(N140404004)。
10.3969/j.issn.1672-6952.2016.06.014