【论文笔记】具有反馈控制的自主优化

写在前面

原论文标题:Timescale Separation in Autonomous Optimization.

本文为近期阅读的论文(Hauswirth 2020)[1]和其前作(Menta 2018)[2]的笔记。该论文研究如图1所示互连反馈系统的稳定性,实际上通过timescale separation假设,直接将物理系统的稳态代入了优化部分,优化部分相当于并未用到状态xx的反馈。

图1. 互连反馈系统

问题描述

这里以线性系统为例。考虑线性时不变(LTI)系统

x˙=Ax+Bu+Qw(1)\begin{aligned} \dot x&=Ax+Bu+Qw \end{aligned}\qquad (1)

其中,xRnx\in\mathbb R^nuRpu\in\mathbb R^pwRqw\in\mathbb R^q

假设1: 存在正定矩阵PRn×nP\in\mathbb R^{n\times n},使得ATP+PAInA^TP+PA\leq-I_n

在假设1下,系统(1)指数稳定,AA可逆,则对固定的uuww,其稳态为x=Ku+Rwx=Ku+Rw,其中K:=A1BRn×pK:=-A^{-1}B\in\mathbb R^{n\times p}R:=A1QRn×qR:=-A^{-1}Q\in\mathbb R^{n\times q}

考虑稳态输出和控制量的优化问题

minx,uΦ(x,u)s.t.x=Ku+Rw,(2)\begin{aligned} \min_{x,u}\quad&\Phi(x,u)\\ \operatorname{s.t.}\quad&x=Ku+Rw, \end{aligned}\qquad (2)

消除约束,转化为无约束优化问题minuΦ~(u)\min_u\,\tilde\Phi(u),其中Φ~(u):=Φ(Ku+Rw,u)\tilde \Phi(u):=\Phi(Ku+Rw,u)。根据链式法则(chain rule),有

Φ~(u):=HTΦ(Ku+Rw,u),\nabla \tilde \Phi(u):= H^T\nabla\Phi(Ku+Rw,u),

其中,HT:=[KT,In]H^T:=[K^T,I_n]

综上所述,给出如下互连系统

x˙=Ax+Bu+Qwu˙=αHTΦ(x,u)(3)\begin{aligned} \dot x&=Ax+Bu+Qw,\\ \dot u&=-\alpha H^T\nabla\Phi(x,u)。 \end{aligned}\qquad (3)

对优化问题min{Φ(x)xΩ}\min\{\Phi(x)|x\in\Omega \},其中Φ:RnR\Phi:\mathbb R^n\to \mathbb R连续可微,点xx^*称为critial,如果它满足一阶最优条件(KKT条件),即xΩx^*\in\OmegaΦ(x)NΩ(x)-\nabla\Phi(x^*)\in N_\Omega(x^*),其中NΩ(x):={vRnvT(yx)0,yΩ}N_\Omega(x):=\{v\in\mathbb R^n|v^T(y-x)\leq 0,\,\forall y\in\Omega\}

Ω={xRnh(x)=0,g(x)0}\Omega=\{x\in\mathbb R^n|h(x)=0,g(x)\leq 0\},其中h:RnRsh:\mathbb R^n\to \mathbb R^sg:RnRrg:\mathbb R^n\to \mathbb R^r,后一个条件等价于存在λRs\lambda\in\mathbb R^sμR+r\mu\in\mathbb R_+^r使得

Φ(x)+h(x)Tλ+g(x)Tμ=0\nabla \Phi(x^*)+\nabla h(x^*)^T\lambda+\nabla g(x^*)^T\mu=0

以及μigi(x)=0\mu_i g_i(x^*)=0对所有i=1,,ri=1,\cdots,r成立。

试问,互连系统(3)能否将系统(1)控制到优化问题(2)的critical point?

最优性分析

这里首先分析一下互连系统(3)的平衡点是否为优化问题(2)的critical point。

命题1: 优化问题(2)每一个极小值(minimizer)都是互连系统(3)的一个平衡点。反之,互连系统(3)的每一个平衡点都是优化问题(2)的一个critical point。

原论文假设线性无关规范满足,因此KKT条件是局部极小值(local minimizer)的必要条件,可以直接给定local minimizer推导到平衡点。但是无法通过平衡点推导到local minimizer,只能推导到critical point。

给定critical point(x,u)(x^*,u^*),满足x=Ku+Rwx^*=Ku^*+RwΦ(x,u)+[In,K]Tλ=0\nabla\Phi(x^*,u^*)+[I_n,-K]^T\lambda=0

注意到[In,K]H=0[I_n,-K]H=0,因此HTΦ(x,u)=0H^T\nabla \Phi(x^*,u^*)=0(x,u)(x^*,u^*)是互连系统(3)的一个平衡点。

反之,给定平衡点(x,u)(x^*,u^*),有x=Ku+Rwx^*=Ku^*+Rw,且Φ(x,u)kerHT=imH\nabla \Phi(x^*,u^*)\in \operatorname{ker}H^T=\operatorname{im} H^\bot。由于imH\operatorname{im} H^\bot[In,K]T[I_n,-K]^T展开,因此Φ(x,u)+[In,K]Tλ=0\nabla\Phi(x^*,u^*)+[I_n,-K]^T\lambda=0。故(x,u)(x^*,u^*)也是critical point。

稳定性分析

假设2: Φ~(u)\tilde \Phi(u)ll-Lipschitz的梯度(gradient)。即HT(Φ(x,u)Φ(x,u))lxx\|H^T(\nabla \Phi(x,u)-\nabla\Phi(x',u))\|\leq l\|x-x'\|。此外,Φ~(u)\tilde \Phi(u)子水平集(sublevel set)是紧集。

如果只知道Φ(x,u)\nabla\Phi(x,u)的lipschitz常数LL,则取l:=LKl:=L\|K\|可满足条件。

定理1: 在假设1、2下,每当满足

α<α:=12lβ(4)\alpha<\alpha^*:=\frac{1}{2l\beta}\qquad (4)

时,互连系统(3)收敛到优化问题(2)的critical point,其中β:=PK\beta:=\|PK\|。此外,只有优化问题(5)的严格local minimizer才是渐进稳定的。

由定理1可以得到,如果优化问题(2)进一步是凸的,那么互连系统(3)收敛到其全局最优解的集合。

我们将定理1的证明分为三个部分。 首先,我们提出了一个LaSalle函数,只要验证了(4),该函数沿系统的轨迹就不会增加(non-increasing)。 其次,我们应用LaSalle的不变性原理并得出结论,所有轨迹都收敛到满足(2)的一阶最优性条件的点集。 第三,我们证明只有(3)的极小值可以渐近稳定。

LaSalle函数

由singular perturbation analysis启发[3],定义如下函数

Zδ(x,u)=(1δ)V(u)+δW(x,u)(5)Z_\delta(x,u)=(1-\delta)V(u)+\delta W(x,u), \qquad (5)

其中0<δ<10<\delta<1是一个凸组合系数,且

V(u):=Φ(Ku+Rw,u)W(x,u):=(xKuRw)TP(xKuRw)\begin{aligned} V(u)&:=\Phi(Ku+Rw,u),\\ W(x,u)&:=(x-Ku-Rw)^TP(x-Ku-Rw)。 \end{aligned}

引理1: Zδ(x,u)Z_\delta(x,u)沿着(3)的李导数满足

Z˙δ(x,u)[ψϕ]Λ[ψϕ]\dot Z_\delta(x,u)\leq \begin{bmatrix}\|\psi\|&\|\phi\|\end{bmatrix}\Lambda\begin{bmatrix}\|\psi\|\\ \|\phi\|\end{bmatrix},

其中

ψ(x,u):=HTΦ(x,u)ϕ(x,u):=xHuRw\begin{aligned} \psi(x,u)&:=H^T\nabla \Phi(x,u),\\ \phi(x,u)&:=x-Hu-Rw, \end{aligned}

以及

Λ:=[α(1δ)α2(l(1δ)+δβ)α2(l(1δ)+δβ)δ2](6)\Lambda:=\begin{bmatrix} -\alpha(1-\delta)&\frac{\alpha}{2}(l(1-\delta)+\delta\beta)\\ \frac{\alpha}{2}(l(1-\delta)+\delta\beta)&-\frac{\delta}{2} \end{bmatrix}。\qquad (6)

引理2: 考虑(6)中的Λ\Lambda,每当α\alpha满足(4),那么对一些δ(0,1)\delta^*\in(0,1)Λ0\Lambda\leq 0

定理1、2证明了Zδ(x,u)Z_{\delta^*}(x,u)在条件(4)下不会增加。下面需要证明Z˙δ(x,u)\dot Z_{\delta^*}(x,u)的zero set中的点是否为平衡点,如果是,进一步证明集合的不变性。

不变性原理

以下引理均在α\alpha满足(4),δ\delta^*按定理2中定义的条件下给出。

引理3: Z˙δ0\dot Z_{\delta^*}\leq 0对所有(x,u)(x,u)成立,Z˙δ(x,u)=0\dot Z_{\delta^*}(x,u)=0当且仅当(x,u)E(x,u)\in E,其中

E={(x,u)x=Ku+Rw,Φ(x,u)kerHT}E=\{(x,u)|x=Ku+Rw,\nabla\Phi(x,u)\in\operatorname{ker} H^T\}。

此外,EE中的每一个点都是一个平衡点。

显然,当Z˙δ(x,u)=0\dot Z_{\delta^*}(x,u)=0时,ψ\|\psi\|ϕ\|\phi\|都是0,即(x,u)E(x,u)\in E。而ψ\|\psi\|ϕ\|\phi\|为0定义上就是平衡点,所以EE本身就是平衡点的集合。

引理4: Zδ(x,u)Z_{\delta^*}(x,u)子水平集(sublevel set)对于互连系统(3)是紧集和正不变集。

注意:如果V(u)cV(u)\leq c的子水平集是紧集,那么存在UU使得uU\|u\|\leq U

由于W(x,u)0W(x,u)\geq 0,故Zδ(x,u)cZ_{\delta^*}(x,u)\leq c是紧的意味着V(u)cV(u)\leq c是紧的。由假设2知,后者确实是紧的,所以uU\|u\|\leq U满足。又由于V(u)V(u)有下界LLW(x,u)cLW(x,u)\leq c-L。因为PP正定,所以xx同样有界。

正不变性由Zδ(x,u)Z_{\delta^*}(x,u)的非增性保证。

Theorem (LaSalle’s Invariance Principle). Let ΩDRn\Omega\subset D\subset \mathbb R^n be a compact set that is positively invariant with respect to an autonomous system η˙=F(η)\dot \eta=F(\eta), where FF is locally Lipschitz. Let Z:DRZ : D\to R be a continuously differentiable function such that Z˙(η)0\dot Z(\eta)\leq 0 in Ω\Omega. Let EE be the set of all the points in Ω\Omega where Z˙(η)=0\dot Z(η) = 0. Let MM be the largest invariant set in E. Then every solution starting in Ω\Omega approaches MM as tt\to\infty.

因此,轨迹收敛到critical point的集合EE

严格极小值的渐进稳定性

假设z:=(x,u)z^*:=(x^*,u^*)是系统(3)的一个渐进稳定平衡点。则zZ:={(x,u)x=Ku+Rw}z^*\in\mathcal Z:=\{(x,u)|x=Ku+Rw\}

考虑reduced system

u˙=αHTΦ(Ku+Rw,u)(7)\dot u=-\alpha H^T\nabla\Phi(Ku+Rw,u)。\qquad (7)

zz^*的一个邻域内,起始于z0z_0,系统(3)和(7)的轨迹均收敛于zz^*,记为z(t)z(t)z(t)z'(t)。区别在于,z(t)z'(t)永远在Z\mathcal Z内部,而z(t)z(t)可能先出去再回来。

同时,对于(7),Φ\Phi在其轨迹z(t)z'(t)上非增,因此Φ(z)Φ(z0)\Phi(z^*)\leq \Phi(z_0)。因为是z0z_0任意的,所以zz^*是局部极小值。

假设存在zˉ\bar z使得Φ(zˉ)Φ(z)\Phi(\bar z)\leq \Phi(z^*)。令z0=zˉz_0=\bar z,系统(3)的轨迹z(t)z(t)收敛于zz^*Φ~(u(t))=0\nabla \tilde \Phi(u(t))=0对几乎所有t0t\geq 0恒成立。这与zz^*渐进稳定矛盾。所以渐近稳定点如果存在,必为严格极小值。


  1. Hauswirth, A., Bolognani, S., Hug, G., & Dörfler, F. (2019). Timescale Separation in Autonomous Optimization. IEEE Transactions on Automatic Control, 1–1. https://doi.org/10.1109/TAC.2020.2989274 ↩︎

  2. Menta, S., Hauswirth, A., Bolognani, S., Hug, G., & Dorfler, F. (2019). Stability of Dynamic Feedback optimization with Applications to Power Systems. In 2018 56th Annual Allerton Conference on Communication, Control, and Computing, Allerton 2018 (pp. 136–143). Institute of Electrical and Electronics Engineers Inc. https://doi.org/10.1109/ALLERTON.2018.8635640 ↩︎

  3. Khalil, H. K. (2002). Nonlinear systems (3rd ed.). Prentice Hall, ISBN: 0130673897. ↩︎