浅谈带约束分布式优化问题的最优性条件

问题描述

考虑常见的带约束分布式优化问题,如下

minF(x)=i=1nfi(xi)s.t.x1=x2=xn,xiΩi,iV,\begin{aligned} \min &\quad F(\boldsymbol x)=\sum_{i=1}^n f_i(x_i)\\ \operatorname{s.t.} &\quad x_1=x_2\cdots= x_n,\\ &\quad x_i\in\Omega_i, \,i\in\mathcal V, \end{aligned}

其中x=[x1T,,xnT]T\boldsymbol x=[x_1^T,\cdots,x_n^T]^T。每个agent的动力学建模为单积分器,即x˙i=ui\dot x_i=u_iiV\forall i\in\mathcal V

先做两个常用假设,一是i=1nΩi\cap_{i=1}^n\Omega_i\neq \emptyset,二是fi(xi)f_i(x_i)强凸。前者保证了解的存在性和Slater's condition成立,从而KKT条件是最优解的充分必要条件;后者保证了解的唯一性。

定义分布式系统的通信拓扑表示为图G=(V,E)\mathcal G=(\mathcal V,\mathcal E),其拉普拉斯矩阵满足L1=0L\boldsymbol 1=\boldsymbol 0。若图G\mathcal G是weighted-balanced,那么拉普拉斯矩阵额外满足1TL=0T\boldsymbol 1^TL=\boldsymbol 0^T

对于闭凸集ΩRn\Omega\in\mathbb R^n,定义投影PΩ(x):=argminzΩxzP_\Omega(x):=\arg\min_{z\in\Omega}\|x-z\|。投影具有如下性质:

(xPΩ(x))T(PΩ(x)z),xRn,zΩPΩ(x)PΩ(y)xy,x,yRn(x-P_\Omega(x))^T(P_\Omega(x)-z),\,\forall x\in\mathbb R^n,\,z\in\Omega,\\ \|P_\Omega(x)-P_\Omega(y)\|\leq \|x-y\|,\,\forall x,y\in\mathbb R^n。

对于xΩx\in\OmegaΩ\Omegaxx处的法锥(normal cone)定义为NΩ(x):={uRnuT(zx)0,zΩ}N_{\Omega}(x):=\{u\in\mathbb R^n|u^T(z-x)\leq \boldsymbol 0,\,\forall z \in\Omega\}

法锥具有如下性质:

x=PΩ(xu)uNΩ(x)x=P_{\Omega}(x-u)\Leftrightarrow - u\in N_{\Omega}(x)。

此外,0NΩ(x)\boldsymbol 0\in N_{\Omega}(x)必定成立。

KKT条件

换个思路,如果考虑集中式优化问题

minF(x)=i=1nfi(x)s.t.xi=1nΩi\begin{aligned} \min&\quad F(x)=\sum_{i=1}^nf_i(x)\\ \operatorname{s.t.} &\quad x\in\cap_{i=1}^n\Omega_i \end{aligned}

由KKT条件,最优解xx满足

0i=1nfi(x)+Ni=1nΩi(x)(1)\boldsymbol 0\in\sum_{i=1}^n\partial f_i(x^*)+N_{\cap_{i=1}^n\Omega_i}(x^*)。\qquad (1)

将原优化问题写成紧凑形式

minF(x)s.t.(LIn)x=0xΩ\begin{aligned} \min&\quad F(\boldsymbol x)\\ \operatorname{s.t.}&\quad (L\otimes I_n)\boldsymbol x=\boldsymbol0,\\ &\quad \boldsymbol x\in\Omega, \end{aligned}

其中Ω=Πi=1nΩi\boldsymbol \Omega=\Pi_{i=1}^n\Omega_i。由KKT条件,最优解x\boldsymbol x^*满足

0f(x)+(LTIn)y+NΩ(x)0=(LIn)x(2)\begin{aligned} \boldsymbol 0&\in\partial \boldsymbol f(\boldsymbol x^*)+(L^T\otimes I_n)\boldsymbol y^*+N_{\boldsymbol \Omega}(\boldsymbol x^*),\\ \boldsymbol 0&=(L\otimes I_n)\boldsymbol x^*。 \end{aligned}\qquad(2)

最优解必定满足上述两个条件其中之一。由于这两个问题等价,所以(2)必定能推出(1)。

无向图的情况

假设图G是连通图。

给出如下算法

x˙i=PΩi(xifi(xi)i=1naij(yiyj))xiy˙i=i=1naij(xixj)\begin{aligned} \dot x_i&=P_{\Omega_i}\left(x_i-\partial f_i(x_i)-\sum_{i=1}^na_{ij}(y_i-y_j)\right)-x_i,\\ \dot y_i&=\sum_{i=1}^na_{ij}(x_i-x_j)。 \end{aligned}

上式紧凑形式为

x˙=PΩ(xf(x)(LIn)y)xy˙=(LIn)x\begin{aligned} \dot {\boldsymbol x}&=P_{\boldsymbol \Omega}(\boldsymbol x-\partial \boldsymbol f(\boldsymbol x)-(L\otimes I_n)\boldsymbol y)-\boldsymbol x,\\ \dot {\boldsymbol y}&= (L\otimes I_n)\boldsymbol x。 \end{aligned}

显然平衡点满足式(2)。

uNΩ(x)\boldsymbol u\in N_{\boldsymbol \Omega}(\boldsymbol x^*),则对任意u\boldsymbol u,都有uT(zx)0\boldsymbol u^T(\boldsymbol z-\boldsymbol x^*)\leq 0zΩ\forall \boldsymbol z\in\boldsymbol \Omega

Ωˉ=i=1nΩi××i=1nΩiΩ\bar {\boldsymbol \Omega}=\cap_{i=1}^n\Omega_i\times\cdots\times\cap_{i=1}^n\Omega_i\in\boldsymbol\Omega。则对于zˉΩˉΩ\forall \bar {\boldsymbol z}\in\bar {\boldsymbol \Omega}\subset\boldsymbol\Omega,上式也成立。

因此,uT(1In)(zˉx)=uT(zˉx)0\boldsymbol u^T (\boldsymbol 1\otimes I_n) (\bar z-x^*)= \boldsymbol u^T (\bar {\boldsymbol z}-\boldsymbol x^*)\leq 0,即,

0(1TIn)(f(x)+(LIn)y))+Ni=1nΩi(x)=i=1nfi(x)+Ni=1nΩi(x)\begin{aligned} 0&\in(\boldsymbol 1^T\otimes I_n)(\partial \boldsymbol f(\boldsymbol x)+(L\otimes I_n)\boldsymbol y))+N_{\cap_{i=1}^n\Omega_i}(x)\\ &=\sum_{i=1}^n\partial f_i(x^*)+N_{\cap_{i=1}^n\Omega_i}(x^*) \end{aligned},

故平衡点同样满足式(1),即(2)能推出(1)。

有向图的情况

假设图GG是weight-balanced且强连通。

给出如下算法

x˙i=PΩi(xifi(xi)i=1naij(xixj)yi)xiy˙i=i=1naij(xixj)\begin{aligned} \dot x_i&=P_{\Omega_i}\left(x_i-\partial f_i(x_i)-\sum_{i=1}^na_{ij}(x_i-x_j)-y_i\right)-x_i,\\ \dot y_i&=\sum_{i=1}^na_{ij}(x_i-x_j), \end{aligned}

其中初始条件i=1nyi(0)=0\sum_{i=1}^n y_i(0)=0

上式紧凑形式为

x˙=PΩ(xf(x)(LIn)xy)xy˙=(LIn)x\begin{aligned} \dot {\boldsymbol x}&=P_{\boldsymbol \Omega}(\boldsymbol x-\partial \boldsymbol f(\boldsymbol x)-(L\otimes I_n)\boldsymbol x-\boldsymbol y)-\boldsymbol x,\\ \dot {\boldsymbol y}&= (L\otimes I_n)\boldsymbol x。 \end{aligned}

由于i=1ny˙i=0\sum_{i=1}^n\dot y_i=0,所以i=1nyi=i=1nyi(0)=0\sum_{i=1}^ny_i=\sum_{i=1}^ny_i(0)=0

令上式左侧为0,可知平衡点满足0=(LIn)x\boldsymbol 0=(L\otimes I_n)\boldsymbol x^*,即consensus条件成立;同时

0f(x)+β(LIn)x+y+NΩ(x)\boldsymbol 0\in \partial \boldsymbol f(\boldsymbol x^*) +\beta(L\otimes I_n)\boldsymbol x^*+\boldsymbol y^*+ N_{\boldsymbol \Omega}(\boldsymbol x^*)

对于任意uNΩ(x)\boldsymbol u\in N_\Omega(\boldsymbol x^*),都有uT(zx)0\boldsymbol u^T(\boldsymbol z-\boldsymbol x^*)\leq 0zΩ\forall \boldsymbol z\in\boldsymbol \Omega

Ωˉ=i=1nΩi××i=1nΩiΩ\bar {\boldsymbol \Omega}=\cap_{i=1}^n\Omega_i\times\cdots\times\cap_{i=1}^n\Omega_i\in\boldsymbol\Omegax=[xT,,xT]T\boldsymbol x^*=[x^{*T},\cdots,x^{*T}]^T。则对于zˉΩˉ\bar {\boldsymbol z}\in\bar {\boldsymbol \Omega},上式也成立。

因此,uT(1In)(zˉx)=uT(zˉx)0\boldsymbol u^T (\boldsymbol 1\otimes I_n) (\bar z-x^*)= \boldsymbol u^T (\bar {\boldsymbol z}-\boldsymbol x^*)\leq \boldsymbol 0,即

0(1TIn)(f(x)+β(LIn)x+y)+Ni=1nΩi(x)=i=1nfi(x)+Ni=1nΩi(x)\begin{aligned} 0&\in(\boldsymbol 1^T\otimes I_n)(\partial \boldsymbol f(\boldsymbol x)+\beta(L\otimes I_n)\boldsymbol x^*+\boldsymbol y^*)+N_{\cap_{i=1}^n\Omega_i}(x)\\ &=\sum_{i=1}^n\partial f_i(x^*)+N_{\cap_{i=1}^n\Omega_i}(x^*) \end{aligned}。

可以看出,关键在于满足投影算子内部的补偿项求和为0,剩下的事情就是证明平衡点的稳定性。