罗斯π引理

罗斯π引理,以 I. Michael Ross 的名字命名,是计算最优控制的结果。

基于为反馈控制生成 Carathéodory-π 解,Ross’ π-lemma 指出存在基本时间常数,在该时间常数内必须计算控制解以实现可控性和稳定性。

这个时间常数称为 Ross 时间常数,与控制非线性控制系统动力学的矢量场的 Lipschitz 常数的倒数成正比。

理论意义

罗斯时间常数定义中的比例因子取决于对设备的扰动幅度和反馈控制的规范。当没有干扰时,Ross’ π-lemma 表明开环最优解与闭环最优解相同。在存在干扰的情况下,比例因子可以写成 Lambert W 函数。

实际应用

在实际应用中,罗斯时间常数可以通过DIDO数值实验得到。Ross 等人表明,这个时间常数与 Caratheodory-π 解决方案的实际实施有关。

也就是说,Ross 等人表明,如果仅通过零阶保持获得反馈解决方案,则需要明显更快的采样率才能实现可控性和稳定性。

罗斯π引理

另一方面,如果通过 Caratheodory-π 技术实现反馈解决方案,则可以适应更大的采样率。这意味着生成反馈解决方案的计算负担明显低于标准实现。这些概念已被用于在存在静态和动态障碍物的不确定和不完整信息的情况下在机器人技术中生成避碰操作。

0

点评

点赞

相关文章