贝尔曼拟谱法

贝尔曼模拟算法是一种基于贝尔曼最优性原理的伪谱最优控制方法。它是更大的伪谱最优控制理论的一部分,伪谱最优控制是罗斯创造的一个术语。

该方法以理查德·E·贝尔曼 (Richard E. Bellman) 的名字命名。它由 Ross 等人首先引入,作为解决多尺度最优控制问题的一种手段,后来扩展为获得一般最优控制问题的次优解。

理论基础

贝尔曼模拟方法的多尺度版本基于 Ross–Fahroo 伪谱方法的谱收敛特性。也就是说,由于 Ross–Fahroo 伪谱方法以指数级的速度收敛,即使解具有高频分量,也可以在非常少的节点数上逐点收敛到解。最优控制中的这种混叠现象最早是由 Ross 等人发现的。

Ross 等人没有使用信号处理技术来消除混叠解决方案。提出可以将贝尔曼最优性原理应用于收敛解以提取节点之间的信息。因为 Gauss–Lobatto 节点聚集在边界点,Ross 等人。

建议如果初始条件周围的节点密度满足奈奎斯特-农采样定理,则可以通过在称为贝尔曼段的分段段上以递归方式解决最优控制问题来恢复完整的解决方案。

在该方法的扩展版本中,Ross 等人提出该方法也可用于生成不一定最优的可行解决方案。在此版本中,即使知道解可能未收敛到最优解,也可以在更少的节点数上应用贝尔曼模拟算法。在这种情况下,人们获得了一个可行的解决方案。

贝尔曼模拟算法的一个显着特点是它根据原始伪谱成本和贝尔曼段总和产生的成本自动确定次优的几个度量。

计算效率

贝尔曼模拟算法的计算优势之一是它允许在节点分布中逃避高斯规则。也就是说,在标准的伪谱方法中,节点的分布是高斯分布的(通常是有限范围的 Gauss-Lobatto 和无限范围的 Gauss-Radau)。高斯点在区间的中间是稀疏的(中间是在无限范围问题的移位意义上定义的)并且在边界处是密集的。

边界附近点的二阶累积具有浪费节点的效果。贝尔曼模拟算法利用初始点的节点积累对解决方案进行抗锯齿处理,并丢弃剩余节点。因此节点的最终分布是非高斯和密集的,而计算方法保留了稀疏结构

贝尔曼拟谱法

应用

贝尔曼模拟算法首先由 Ross 等人应用。解决极低推力轨迹优化的挑战性问题。它已成功应用于解决一个实际问题,即为将太空舱从月球轨道带到精确定位的地球界面条件以成功再入的跨地球注入问题生成非常高精度的解决方案。

贝尔曼模拟法最常用于对 Ross–Fahroo 伪谱方法生成的伪谱解的最优性进行额外检查。也就是说,除了结合使用 Pontryagin 的最小值原理和 Ross–Fahroo 伪谱方法获得的解之外,贝尔曼模拟算法还被用作对计算解的最优性的纯原始检验。

0

点评

点赞

相关文章