Skip to content

Ilqr和ddp的最大区别

首先两者都是适用于非线性模型的,cost也是非线性的

ILQR

iLQR是将模型一阶线性化cost function 二阶泰勒近似,然后利用LQR求极值,在新极值的条件下,
再次将环境一阶线性化,cost function 二阶泰勒近似,求极值,指导损失函数收敛;

DDP

DDP是将模型二阶线性化cost function 二阶泰勒近似