Definicija. Množica $A \subseteq \mathbb{R}^m$ je konveksna, če za vsaka $x, y \in A$ in vsak $\lambda \in [0, 1]$ velja $(1 - \lambda) x + \lambda y \in A$.
Torej: množica $A$ je konveksna, če je vsaka daljica s krajišči v množici $A$ v celoti vsebovana v $A$.
Trditev. Presek konveksnih množic je konveksen: $A_i$ ($i \in I$) konveksne $\Rightarrow \bigcap_{i \in I} A_i$ konveksna.
Dokaz. Preveriti moramo: za vsaka $x, y \in \bigcap_{i \in I} A_i$ in vsak $\lambda \in [0, 1]$ velja $\forall i \in I: (1-\lambda) x + \lambda y \in A_i$. To je res, ker so množice $A_i$ ($i \in I$) konveksne.
Definicija. Vektor $\lambda_1 x_1 + \lambda_2 x_2 + \dots + \lambda_n x_n$, kjer $\lambda_1, \lambda_2, \dots, \lambda_n \ge 0$, $\lambda_1 + \lambda_2 + \dots + \lambda_n = 1$, je konveksna kombinacija vektorjev $x_1, x_2, \dots, x_n$.
Za $n = 2$ pišemo $\lambda := \lambda_2$, $\lambda_1 = 1 - \lambda$, torej $\lambda_1 x_1 + \lambda_2 x_2 = (1 - \lambda) x_1 + \lambda x_2$.
Trditev. Množica $A$ je konveksna natanko tedaj, ko je v $A$ vsaka konveksna kombinacija vektorjev iz $A$.
$n > 2$: če $\lambda_n = 1$, potem $\lambda_1 = \lambda_2 = \dots = \lambda_{n-1} = 0$ in $x = 1 \cdot x_n = x_n \in A$. Sicer $\lambda_n < 1$ - tedaj naj bo
\[y := {\lambda_1 x_1 + \lambda_2 x_2 + \dots + \lambda_{n-1} x_{n-1} \over 1 - \lambda_n} .\]</span>
Definicija. Množica $\operatorname{conv}(A) := \bigcap_{\substack{K \supseteq A \ K \text{ konveksna}}} K$ je konveksna ogrinjača (ali konveksna ovojnica) množice $A \subseteq \mathbb{R}^m$.
Opomba. Primerjaj z linearno ogrinjačo $\operatorname{Lin}(A) = \bigcap_{\substack{V \supseteq A \ V \text{ podprostor}}} V$.
Trditev. Naj bosta $A, B \subseteq \mathbb{R}^m$ množici, pri čemer je množica $B$ konveksna. Potem velja sledeče.
5.
\[\begin{multlined} \operatorname{conv}(A) = \lbrace \lambda_1 x_1 + \lambda_2 x_2 + \dots + \lambda_n x_n \mid \\ n \in \mathbb{N}, x_1, x_2, \dots, x_n \in A, \lambda_1, \lambda_2, \dots, \lambda_n \ge 0, \lambda_1 + \lambda_2 + \dots + \lambda_n = 1 \rbrace \end{multlined}\]- tj., množica konveksnih kombinacij vektorjev iz $A$.
</span>
</span>
5. Naj bo $C$ množica konveksnih kombinacij vektorjev iz $A$. Dokažimo $\operatorname{conv}(A) = C$.
$C$ je konveksna, ker je vsaka konveksna kombinacija vektorjev $x, y \in C$
\[\begin{aligned} z &= (1 - \lambda) x + \lambda y \\ &= (1 - \lambda)(\mu_1 x_1 + \dots + \mu_k x_k) + \lambda (\nu_1 y_1 + \dots + \nu_\ell y_\ell) \\ &= (1 - \lambda) \mu_1 x_1 + \dots + (1 - \lambda) \mu_k x_k + \lambda \nu_1 y_1 + \dots + \lambda \nu_\ell y_\ell \end{aligned}\]tudi konveksna kombinacija vektorjev $x_1, \dots, x_k, y_1, \dots, y_\ell \in A$, saj $(1-\lambda) \mu_i, \lambda \nu_j \ge 0$ ($1 \le i \le k$, $1 \le j \le \ell$) in $\sum_{i=1}^k (1 - \lambda) \mu_i + \sum_{j=1}^\ell \lambda \nu_j = (1 - \lambda) + \lambda = 1$, torej $z \in C$.
</span>
Definicija. Naj bo $A$ konveksna množica. Točka $a \in A$ je ekstremna točka, če velja $\forall x, y \in A \ \forall \lambda \in (0, 1): (a = (1 - \lambda) x + \lambda y \Rightarrow x = y = a)$ (tj., $a$ ne leži v notranjosti nobene daljice med različnima točkama iz $A$).
Primer. Ekstremne točke so prikazane z rdečo barvo.

</span>

</span>

Ni ekstremnih točk!
</span>
</span>
Definicija. Množica $A \ne \emptyset$ je afina, če velja $\forall x, y \in A \ \forall \lambda \in \mathbb{R}: (1 - \lambda) x + \lambda y \in A$ (tj., vsaka premica skozi različni točki iz $A$ je vsebovana v $A$).
Definicija. Vektor $\lambda_1 x_1 + \lambda_2 x_2 + \dots + \lambda_n x_n$, kjer je $\lambda_1 + \lambda_2 + \dots + \lambda_n = 1$, je afina kombinacija vektorjev $x_1, x_2, \dots, x_n$.
Trditev. Naj bo $A \subseteq \mathbb{R}^m$ neprazna množica. Sledeče trditve so ekvivalentne.
</span>
Opomba. Primeri afinih množic so premica v $\mathbb{R}^m$, ravnina v $\mathbb{R}^m$, … - rečemo jim tudi afini podprostori. Definiramo lahko tudi dimenzijo afinega podprostora.
Naj bo $x = \lambda_1 x_1 + \lambda_2 x_2 + \dots + \lambda_n x_n$ afina kombinacija vektorjev $x_1, x_2, \dots, x_n \in A$. Naredimo indukcijo na $n$.
$n > 2$: brez škode za splošnost vzamemo $\lambda_n \ne 1$ - tedaj naj bo
\[y := {\lambda_1 x_1 + \lambda_2 x_2 + \dots + \lambda_{n-1} x_{n-1} \over 1 - \lambda_n} .\]</span>
(2. $\Rightarrow$ 3.) Naj bo $v \in A$ poljuben vektor. Potem je $V := A - v$ linearen podprostor, saj za vsake $x, y \in A$ ter $\mu, \nu \in \mathbb{R}$ velja
\[\begin{aligned} \mu (x - v) + \nu (y - v) &= \mu x + \nu y - \mu v - \nu v \\ &= \mu x + \nu y + (1 - \mu - \nu) v - v \in V, \end{aligned}\]saj $x, y, v \in A$ ter $\mu + \nu + (1 - \mu - \nu) = 1$. Velja torej $A = V + v$.
(3. $\Rightarrow$ 1.) Poljubna vektorja iz $A$ lahko zapišemo kot $x+v$ in $y+v$, kjer $x, y \in V$. Za poljuben $\lambda \in \mathbb{R}$ velja
\[(1 - \lambda) (x + v) + \lambda (y + v) = (1 - \lambda) x + \lambda y + v \in A.\]Definicija. Množica $A \subseteq \mathbb{R}^m$ je konveksen stožec, če velja $\forall x, y \in A \ \forall \lambda, \mu \ge 0: \lambda x + \mu y \in A$.
Opomba. Če za vsaka $x, y \in A$ velja
Vsak konveksen stožec je konveksna množica; obratno ne velja.
Definicija. Množica
\[S(a_1, a_2, \dots, a_n) := \lbrace \lambda_1 a_1 + \lambda_2 a_2 + \dots \lambda_n a_n \mid \lambda_1, \lambda_2, \dots, \lambda_n \ge 0 \rbrace\]je konveksen stožec, napet na vektorjih $a_1, a_2, \dots, a_n$.
Trditev. Množica $S(a_1, a_2, \dots, a_n)$ je konveksen stožec.
Dokaz. Naj bodo $\lambda, \lambda_1, \dots, \lambda_n, \mu, \mu_1, \dots, \mu_n \ge 0$. Potem velja
\[\begin{multlined} \lambda (\lambda_1 a_1 + \dots + \lambda_n a_n) + \mu (\mu_1 a_1 + \dots + \mu_n a_n) = \\ (\lambda \lambda_1 + \mu \mu_1) a_1 + \dots + (\lambda \lambda_n + \mu \mu_n) a_n \in S(a_1, \dots, a_n), \end{multlined}\]saj $\lambda \lambda_i + \mu \mu_i \ge 0$ ($1 \le i \le n$).

</span>
</span></span>
$S(a_1, a_2, a_3)$:

</span>
Definicija. Naj bo $A \subseteq \mathbb{R}^m$. Množici
\[A^\ast := \lbrace x \in \mathbb{R}^m \mid \forall a \in A: a^\top x \ge 0 \rbrace\](tj., množici vektorjev, ki tvorijo ostri kot z vsemi vektorji iz $A$) pravimo dualni stožec množice $A$.
</span>

</span>
</span>
Trditev. Dualni stožec $A^\ast$ množice $A$ je konveksen stožec.
Dokaz. Vzemimo poljubne $x, y \in A^\ast$ in $\lambda, \mu \ge 0$. Potem za vsak $a \in A$ velja
\[a^\top (\lambda x + \mu y) = \lambda \, a^\top x + \mu \, a^\top y \ge 0,\]torej $\lambda x + \mu y \in A^\ast$.
Trditev. $A \subseteq A^{\ast\ast}$.
Opomba. V splošnem ne velja $A = A^{\ast\ast}$ (npr. če $A$ ni konveksen stožec).
Dokaz. Vzemimo poljuben $x \in A$. Potem za vsak $y \in A^\ast$ velja $x^\top y \ge 0$, torej velja tudi $x \in A^{\ast\ast}$.
Izrek (Farkaseva lema - geometrijska oblika). $S^{\ast\ast}(a_1, a_2, \dots, a_n) = S(a_1, a_2, \dots, a_n)$.
Dokaz.
($\subseteq$) Naj bo $A = [a_1 \, a_2 \, \dots \, a_n]$ matrika s stolpci $a_1, a_2, \dots, a_n$ in $b \in S^{\ast\ast}(a_1, a_2, \dots, a_n)$. Definirajmo linearni program $\Pi$ in njegov dual $\Pi’$:
\[\begin{aligned} \Pi: \quad \max \ 0^\top x \\[1ex] \text{p.p.} \quad A x &= b \\ x &\ge 0 \end{aligned}\]
</span>
\[\begin{aligned} \Pi': \quad \min \ b^\top y \\[1ex] \text{p.p.} \quad A^\top y &\ge 0 \\ \phantom{} \end{aligned}\]
</span>
</span>
Naj bo $y$ dopustna rešitev za $\Pi’$, torej velja $A^\top y \ge 0$ oziroma
\[\forall i \in \lbrace 1, 2, \dots, n \rbrace: \ a_i^\top y \ge 0.\]Potem za poljubne $\lambda_1, \lambda_2, \dots, \lambda_n \ge 0$ velja
\[(\lambda_1 a_1 + \lambda_2 a_2 + \dots + \lambda_n a_n)^\top y = \lambda_1 \, a_1^\top y + \lambda_2 \, a_2^\top y + \dots + \lambda_n \, a_n^\top y \ge 0\]Po krepkem izreku o dualnosti je tudi $\Pi$ optimalen, torej $\exists x \ge 0: Ax = b$ oziroma
\[\exists x_1, x_2, \dots, x_n \ge 0: \ x_1 a_1 + x_2 a_2 + \dots + x_n a_n = b,\]iz česar sledi $b \in S(a_1, a_2, \dots, a_n)$.
Dokaz.
1. Naj bodo $a_1, a_2, \dots, a_n$ stolpci matrike $A$. Potem je izjava ekvivalentna izjavi $b \in S(a_1, a_2, \dots, a_n) \Longleftrightarrow b \in S^{\ast\ast}(a_1, a_2, \dots, a_n)$, ki sledi iz geometrijske oblike Farkaseve leme.
</span>
Obravnavamo linearna programa:
2.
\[\begin{aligned} \Pi: \quad \max \ 0^\top x \\[1ex] \text{p.p.} \quad A x &\le b \\ x &\ge 0 \end{aligned}\]
</span>
\[\begin{aligned} \Pi': \quad \min \ b^\top y \\[1ex] \text{p.p.} \quad A^\top y &\ge 0 \\ y &\ge 0 \end{aligned}\]
</span>
</span>
3.
\[\begin{aligned} \Pi: \quad \max \ 0^\top x \\[1ex] \text{p.p.} \quad A x &= b \end{aligned}\]
</span>
\[\begin{aligned} \Pi': \quad \min \ b^\top y \\[1ex] \text{p.p.} \quad A^\top y &= 0 \end{aligned}\]
</span>
</span>
</span>
4.
\[\begin{aligned} \Pi: \quad \max \ 0^\top x \\[1ex] \text{p.p.} \quad A x &\le b \\ \phantom{} \end{aligned}\]
</span>
\[\begin{aligned} \Pi': \quad \min \ b^\top y \\[1ex] \text{p.p.} \quad A^\top y &= 0 \\ y &\ge 0 \end{aligned}\]
</span>
</span>
</span>
V vseh primerih ekvivalenco dokažemo tako:
</span>
</span>
</span>
1. Ali obstaja nenegativna rešitev sistema linearnih enačb $Ax = b$?
Če obstaja, jo zapišemo. Če ne obstaja, poiščemo $y$, da velja $A^\top y \ge 0$, $b^\top y < 0$.
\[\begin{aligned} x_1 - x_2 + 2 x_3 &= 1 & / \cdot 1 \\ -x_1 - x_2 + x_3 &= 2 & / \cdot (-1) \\ \hline 2 x_1 + x_3 &= -1 \end{aligned}\]Dokažimo, da zgornji sistem nima nenegativnih rešitev.
\[\begin{aligned} A &= \begin{bmatrix} 1 & -1 & 2 \\ -1 & -1 & 1 \end{bmatrix}, \quad b = \begin{bmatrix} 1 \\ 2 \end{bmatrix}, \quad y = \begin{bmatrix} 1 \\ -1 \end{bmatrix} \\ A^\top y &= \begin{bmatrix} 1 & -1 \\ -1 & -1 \\ 2 & 1 \end{bmatrix} \begin{bmatrix} 1 \\ -1 \end{bmatrix} = \begin{bmatrix} 2 \\ 0 \\ 1 \end{bmatrix} \ge 0, \quad b^\top y = -1 < 0 \end{aligned}\]Ustrezen $x$ oziroma $y$ lahko poiščemo s simpleksno metodo.
</span>
2. Pokažimo, da linearni program nima dopustne rešitve.
</span>
3. Enakovredna izjava: $\exists x: \ Ax = b \ \Longleftrightarrow \ \forall y: \ (A^\top y = 0 \Rightarrow b^\top y = 0)$.
</span>
Ekvivalentna trditev Farkasevi lemi:
\[b \not\in S(a_1, a_2, \dots, a_n) \Longleftrightarrow b \not\in S^{\ast\ast}(a_1, a_2, \dots, a_n).\]Torej ($\Longrightarrow$): če $b$ ni v konveksnem stožcu, napetem na $a_1, a_2, \dots, a_n$, potem $b$ ne tvori ostrega kota z $y \in S^\ast(a_1, a_2, \dots, a_n)$ - med $b$ in $S(a_1, a_2, \dots, a_n)$ je tako neka hiperravnina.
</span>

</span>
</span>
Konveksne funkcije so “obrnjene navzgor”, npr $f(x) = x^2$.

</span>
Funkcija $f : K \to \mathbb{R}$ je konveksna, če velja
\[\forall x, y \in K \ \forall \lambda \in [0, 1]: f((1 - \lambda) x + \lambda y) \le (1 - \lambda) f(x) + \lambda f(y)\]Torej: graf funkcije leži pod zveznicami točk na grafu.
Funkcija $f : K \to \mathbb{R}$ je konkavna, če velja
\[\forall x, y \in K \ \forall \lambda \in [0, 1]: f((1 - \lambda) x + \lambda y) \ge (1 - \lambda) f(x) + \lambda f(y)\]Torej: $f$ je konkavna $\Longleftrightarrow$ $-f$ je konveksna.
Funkcija $f : K \to \mathbb{R}$ je strogo konveksna, če velja
\[\forall x, y \in K \ \forall \lambda \in (0, 1): (x \ne y \Rightarrow f((1 - \lambda) x + \lambda y) < (1 - \lambda) f(x) + \lambda f(y))\]Funkcija $f : K \to \mathbb{R}$ je strogo konkavna, če velja
\[\forall x, y \in K \ \forall \lambda \in (0, 1): (x \ne y \Rightarrow f((1 - \lambda) x + \lambda y) > (1 - \lambda) f(x) + \lambda f(y))\]</span>
Trdimo: $f(x) = x^2$ je konveksna funkcija (za vsak interval $K$).
\[\begin{aligned} & f((1 - \lambda) x + \lambda y) \stackrel{?}{\le} (1 - \lambda) f(x) + \lambda f(y) \\[2ex] & ((1 - \lambda) x + \lambda y)^2 - ((1 - \lambda) x^2 + \lambda y^2) \\ &= (1 - \lambda)^2 x^2 + 2(1 - \lambda) \lambda xy + \lambda^2 y^2 - (1 - \lambda) x^2 - \lambda y^2 \\ &= (1 - \lambda)(1 - \lambda - 1) x^2 + 2(1 - \lambda) \lambda xy + \lambda (\lambda - 1) y^2 \\ &= -\lambda(1 - \lambda) (x^2 - 2xy + y^2) = -\lambda(1 - \lambda) (x - y)^2 \le 0 \end{aligned}\]Afina funkcija $f(x_1, x_2, \dots, x_n) = a_1 x_1 + a_2 x_2 + \dots + a_n x_n + b$ (ali $f(x) = a^\top x + b$) je konveksna:
\[\begin{aligned} f((1 - \lambda) x + \lambda y) &= a^\top ((1 - \lambda) x + \lambda y) + b \\ &= (1 - \lambda) a^\top x + \lambda a^\top y + (1 - \lambda) b + \lambda b \\ &= (1 - \lambda) f(x) + \lambda f(y) \end{aligned}\]Primer: dolžina vektorja $\Vert x \Vert = \sqrt{x^\top x} = \sqrt{x_1^2 + x_2^2 + \dots + x_n^2}$
Norma je konveksna:
\[\Vert (1 - \lambda) x + \lambda y \Vert \le \Vert (1 - \lambda) x \Vert + \Vert \lambda y \Vert = (1 - \lambda) \Vert x \Vert + \lambda \Vert y \Vert\]
Trditev. Naj bo $K \subseteq \mathbb{R}^n$ konveksna množica ter $f, g: K \to \mathbb{R}$ konveksni funkciji. Potem velja sledeče.
Trditev. Naj bo $K \subseteq \mathbb{R}^n$ konveksna množica ter $f: K \to \mathbb{R}$ in $g: \operatorname{conv}(f(K)) \to \mathbb{R}$ konveksni funkciji. Denimo, da velja vsaj eno od sledečega.
Potem je kompozitum $g \circ f$ konveksna funkcija.
</span>
1.
\[(c \cdot f)((1 - \lambda) x + \lambda y) \le c ((1 - \lambda) f(x) + \lambda f(y)) = ((1 - \lambda) (c \cdot f)(x) + \lambda (c \cdot f)(y))\]2.
\[\begin{aligned} (f + g)((1 - \lambda) x + \lambda y) &= f((1 - \lambda) x + \lambda y) + g((1 - \lambda) x + \lambda y) \\ &\le (1 - \lambda) f(x) + \lambda f(y) + (1 - \lambda) g(x) + \lambda g(y) \\ &= (1 - \lambda) (f + g)(x) + \lambda (f + g)(y) \end{aligned}\]3. Funkcija $f(x) = a^\top x + b$ je konveksna in konkavna, za $x, y \in K$ velja $f(x), f(y) \in f(K)$. Ker je $(1 - \lambda) x + \lambda y \in K$, velja
\[(1 - \lambda) f(x) + \lambda f(y) = f((1 - \lambda) x + \lambda y) \in f(K).\]Trdimo, da velja
\[\begin{aligned} f((1 - \lambda) x + \lambda y) &\le (1 - \lambda) f(x) + \lambda f(y) \\ g(f((1 - \lambda) x + \lambda y)) &\le g((1 - \lambda) f(x) + \lambda f(y)) \\ &\le (1 - \lambda) (g \circ f)(x) + \lambda (g \circ f)(y) \end{aligned}\]Slika konveksne množice s konveksno funkcijo ni nujno konveksna množica:
\[\begin{aligned} f:&\ [0, 1] \to \mathbb{R} \\ f(x) &= \begin{cases} 0 & \text{če } 0 \le x < 1 \\ 1 & \text{če } x = 1 \end{cases} \\ f([0, 1]) &= \lbrace 0, 1 \rbrace \end{aligned}\]Definicija. Naj bo $A \subseteq \mathbb{R}^n$ in $f: A \to \mathbb{R}$. Funkcija $f$ ima v točki $x^\ast \in A$:
Trditev. Naj bo $K \subseteq \mathbb{R}^n$ konveksna množica ter $f: K \to \mathbb{R}$ konveksna funkcija. Če ima $f$ v $x^\ast \in K$ lokalni minimum, ima v $x^\ast$ tudi globalni minimum.
Tedaj za vsak $\lambda \in (0, 1]$ velja
\[f((1 - \lambda) x^\ast + \lambda y) \le (1 - \lambda) f(x^\ast) + \lambda f(y) < (1 - \lambda) f(x^\ast) + \lambda f(x^\ast) = f(x^\ast) .\]Za dovolj majhen $\lambda$ je $(1 - \lambda) x^\ast + \lambda y$ poljubno blizu $x^\ast$:
\[\Vert (1 - \lambda) x^\ast + \lambda y - x^\ast \Vert = \Vert \lambda (y - x^\ast) \Vert = \lambda \Vert y - x^\ast \Vert < \epsilon, \text{ če } \lambda < {\epsilon \over \Vert y - x^\ast \Vert}\]Preverjanje konveksnosti po definiciji je v splošnem težko. Večinoma je lažje preverjati konveksnost z odvodi.
Naj bo $f: (a, b) \to \mathbb{R}$ konveksna funkcija. Njen graf potem leži nad vsako tangento (kriterij 1. odvoda), torej $f(y) \ge f(x) + (y-x) f’(x)$ za vsaka $x, y \in (a, b)$.
Primer. Naj bo $f(x) = x^2$. Preverimo, ali za vsaka $x, y \in \mathbb{R}$ velja
\[y^2 \stackrel{?}{\ge} x^2 + (y-x) \cdot 2x .\]Res:
\[y^2 - x^2 - 2xy + 2x^2 = y^2 - 2xy + x^2 = (x-y)^2 \ge 0.\]Smerni koeficienti tangent na graf konveksne funkcije $f$ naraščajo - njen odvod $f’$ je torej naraščajoča funkcija, torej $f’‘(x) \ge 0$ za vsak $x \in (a, b)$ (kriterij 2. odvoda).
Primer. Naj bo $f(x) = x^2$. Potem je $f’‘(x) = 2 \ge 0$.
Potem velja:
\[\begin{aligned} f(x) &\ge f(z) + (\nabla f(z))^\top (x - z) &&/ \cdot (1 - \lambda) \\ f(y) &\ge f(z) + (\nabla f(z))^\top (y - z) &&/ \cdot \lambda \\ \hline (1 - \lambda) f(x) + \lambda f(y) &\ge f(z) + (\nabla f(z))^\top ((1 - \lambda) x + \lambda y - z) \\ &= f((1 - \lambda) x + \lambda y) \end{aligned}\]Zadostuje, da za vse $\lambda \in (-\epsilon, 0]$ velja
\[\Vert (1 - \lambda) x + \lambda y - x \Vert = \Vert \lambda y - \lambda x \Vert = \vert \lambda \vert \Vert y - x \Vert < \delta.\]Izračunajmo $g’_{x, y}(\lambda)$.
\[\begin{aligned} g'_{x, y}(\lambda) &= {d \over d \lambda} f((1 - \lambda) x + \lambda y) \\ &= {d \over d \lambda} f((1 - \lambda) x_1 + \lambda y_1, \dots, (1 - \lambda) x_n + \lambda y_n) \\ &= {\partial f \over \partial x_1}((1 - \lambda) x + \lambda y) \cdot (y_1 - x_1) + \dots + {\partial f \over \partial x_n}((1 - \lambda) x + \lambda y) \cdot (y_n - x_n) \\ &= (\nabla f((1 - \lambda) x + \lambda y))^\top (y - x) \end{aligned}\]Velja torej $g’_{x, y}(0) = (\nabla f(x))^\top (y - x)$.
Po definiciji odvoda nadalje velja
\[\begin{aligned} g'_{x, y}(0) &= \lim_{\lambda \to 0} {g_{x, y}(\lambda) - g_{x, y}(0) \over \lambda} \\ &= \lim_{\lambda \to 0} {f((1 - \lambda) x + \lambda y) - f(x) \over \lambda} \\ &= \lim_{\lambda \searrow 0} {f((1 - \lambda) x + \lambda y) - f(x) \over \lambda} \\ &\le \lim_{\lambda \searrow 0} {(1 - \lambda) f(x) + \lambda f(y) - f(x) \over \lambda} & \text{(ker $\lambda > 0$)} \\ &= f(y) - f(x). \end{aligned}\]Velja torej $f(y) \ge f(x) + (\nabla f(x))^\top (y - x)$.
Potem je funkcija $f$ konveksna natanko tedaj, ko za vsak $x \in (a, b)$ velja $f’‘(x) \ge 0$.
Zaradi konveksnosti funkcije $f$ potem velja:
\[f(x) = f\left({1 \over 2} (x + h) + {1 \over 2} (x - h)\right) \le {1 \over 2} f(x + h) + {1 \over 2} f(x - h)\]Z dvakratno uporabo L’Hôpitalovega pravila potem izpeljemo
\[\begin{aligned} 0 \le \lim_{h \to 0} {f(x + h) + f(x - h) - 2f(x) \over h^2} &= \lim_{h \to 0} {f'(x + h) - f'(x - h) \over 2h} \\ &= \lim_{h \to 0} {f''(x + h) + f''(x - h) \over 2} = f''(x). \end{aligned}\]</span>
Po Lagrangeevem izreku velja
\[\begin{aligned} \exists \xi_1 &\in (x, z): & {f(z) - f(x) \over z - x} &= f'(\xi_1) \\ \exists \xi_2 &\in (z, y): & {f(y) - f(z) \over y - z} &= f'(\xi_2) \\ \exists \xi_3 &\in (\xi_1, \xi_2): & {f'(\xi_2) - f'(\xi_1) \over \xi_2 - \xi_1} &= f''(\xi_3) \end{aligned}\]Velja torej:
\[\begin{aligned} {f(z) - f(x) \over z - x} &\le {f(y) - f(z) \over y - z} & / \cdot (z - x)(y - z) \\ (y - z)(f(z) - f(x)) &\le (z - x)(f(y) - f(z)) \\ (y - z + z - x) f(z) &\le (y - z) f(x) + (z - x) f(y) \\ (y - x) f(z) &\le (1 - \lambda)(y - x) f(x) + \lambda (y - x) f(y) \\ f((1 - \lambda) x + \lambda y) &\le (1 - \lambda) f(x) + \lambda f(y) \end{aligned}\]Matrika $A$ je diagonalizabilna, če obstaja $n$ linearno neodvisnih lastnih vektorjev.
Primer. Matrika $A = \begin{bmatrix} 0 & 1 \ 0 & 0 \end{bmatrix}$ ni diagonalizabilna:
\[\begin{gathered} \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} = \begin{bmatrix} y \\ 0 \end{bmatrix} = \lambda \begin{bmatrix} x \\ y \end{bmatrix} \\ \begin{aligned} \lambda &= 0: & y &= 0, & x &\ne 0 \\ \lambda &\ne 0: & y &= 0, & x &= 0 & \text{ni lastni vektor} \end{aligned} \end{gathered}\]Lastne vrednosti poiščemo kot ničle karakterističnega polinoma $\det(A - \lambda I)$. Lastni vektorji so neničelne rešitve enačbe $(A - \lambda I) x = 0$ za lastne vrednosti $\lambda$.
Realna matrika ima lahko kompleksne lastne vrednosti in lastne vektorje:
\[A = \begin{bmatrix} 0 & 1 \\ -1 & 0 \end{bmatrix} \qquad \begin{vmatrix} -\lambda & 1 \\ -1 & -\lambda \end{vmatrix} = \lambda^2 + 1, \quad \lambda = \pm i\]Če je $A$ diagonalizabilna matrika, jo lahko zapišemo kot $A = PDP^{-1}$, kjer je $P$ obrnljiva matrika, katere stolpci so linearno neodvisni lastni vektorji, $D$ pa diagonalna matrika z ustreznimi lastnimi vrednostmi na diagonali.
Definicija. Matrika $A \in \mathbb{R}^{n \times n}$ je simetrična, če velja $A^\top = A$.
Izrek. Simetrična matrika $A \in \mathbb{R}^{n \times n}$ ima realne lastne vrednosti in je diagonalizabilna v ortonormirani bazi (tj., lastni vektorji imajo normo $1$ in so drug na drugega pravokotni).
Definicija. Naj bo $A \in \mathbb{R}^{n \times n}$ simetrična matrika.
Definicija. Naj bo $A = \lparen a_{ij} \rparen_{i,j=1}^n \in \mathbb{R}^{n \times n}$ simetrična matrika. Kvadratna forma, ki pripada $A$, je
\[f(x) = x^\top A x = [x_1 \ x_2 \ \dots \ x_n] \begin{bmatrix} a_{11} x_1 + a_{12} x_2 + \dots a_{1n} x_n \\ a_{21} x_1 + a_{22} x_2 + \dots a_{2n} x_n \\ \vdots \\ a_{n1} x_1 + a_{n2} x_2 + \dots a_{nn} x_n \end{bmatrix} = \sum_{i=1}^n \sum_{j=1}^n a_{ij} x_i x_j\]Primera.
</span>
Trditev.
Potem velja
\[x^\top A x = x^\top UDU^\top x = \tilde{x}^\top D \tilde{x} = \sum_{i=1}^n \lambda_i \tilde{x}_i^2.\]
Naj bo $A$ simetrična matrika dimenzij $2 \times 2$: $\quad A = \begin{bmatrix} a & b \ b & c \end{bmatrix}$
Potem velja:
\[\begin{alignedat}{8} A \ge 0 \quad &\Leftrightarrow &\quad \lambda_1, \lambda_2 &\ge 0 \quad \Leftrightarrow &\quad \lambda_1 + \lambda_2 &\ge 0 &\quad &\Leftrightarrow &\quad \operatorname{tr} A &=&\ a + c &\ge 0 \\ &&&& \lambda_1 \lambda_2 &\ge 0 &&& \det A &=&\ ac - b^2 &\ge 0 \\[1ex] A > 0 \quad &\Leftrightarrow &\quad \lambda_1, \lambda_2 &> 0 \quad \Leftrightarrow &\quad \lambda_1 + \lambda_2 &> 0 &\quad &\Leftrightarrow &&&\ a + c &> 0 &\quad &\Leftrightarrow & a &> 0 \\ &&&& \lambda_1 \lambda_2 &> 0 &&&&& ac - b^2 &> 0 &&& ac - b^2 &> 0 \\[1ex] A \le 0 \quad &\Leftrightarrow &\quad \lambda_1, \lambda_2 &\le 0 \quad \Leftrightarrow &\quad \lambda_1 + \lambda_2 &\le 0 &\quad &\Leftrightarrow &&&\ a + c &\le 0 \\ &&&& \lambda_1 \lambda_2 &\ge 0 &&&&& ac - b^2 &\ge 0 \\[1ex] A < 0 \quad &\Leftrightarrow &\quad \lambda_1, \lambda_2 &< 0 \quad \Leftrightarrow &\quad \lambda_1 + \lambda_2 &< 0 &\quad &\Leftrightarrow &&&\ a + c &< 0 &\quad &\Leftrightarrow & a &< 0 \\ &&&& \lambda_1 \lambda_2 &> 0 &&&&& ac - b^2 &> 0 &&& ac - b^2 &> 0 \\[1ex] A \text{ nedefinitna} \quad &\Leftrightarrow &\quad \lambda_1 &> 0 \quad \Leftrightarrow &\quad \lambda_1 \lambda_2 &< 0 &\quad &\Leftrightarrow &&& ac - b^2 &< 0 \\ && \lambda_2 &< 0 \end{alignedat}\]Definicija. Glavne poddeterminante matrike $A = (a_{ij})_{i,j=1}^n \in \mathbb{R}^{n \times n}$ so vrednosti $\det (a_{ij})_{i,j=1}^\ell$ ($1 \le \ell \le n$).
Trditev. Naj bo $A \in \mathbb{R}^{n \times n}$ simetrična matrika. Potem velja:
Potem je funkcija $f$ konveksna natanko tedaj, ko za vsak $x \in K$ velja $H_f(x) \ge 0$.
Ker je $f$ konveksna, velja:
\[\begin{aligned} f((1 - \lambda)((1 - t) x + ty) + \lambda ((1 - s) x + sy)) &\le (1 - \lambda) f((1 - t) x + ty) + \lambda f((1 - s) x + sy) \\ f((1 - (1 - \lambda) t - \lambda s) x + ((1 - \lambda) t + \lambda s) y) &\le (1 - \lambda) f((1 - t) x + ty) + \lambda f((1 - s) x + sy) \\ h_{x,y}((1 - \lambda) t + \lambda s) &\le (1 - \lambda) h_{x,y}(t) + \lambda h_{x,y}(s) \end{aligned}\]Ker je za vsaka $x, y \in K$ funkcija $h_{x,y}$ konveksna, za vsak $\lambda \in [0, 1]$ velja:
\[\begin{aligned} h_{x,y}(\lambda) = h_{x,y}((1 - \lambda) \cdot 0 + \lambda \cdot 1) &\le (1 - \lambda) h_{x,y}(0) + \lambda h_{x,y}(1) \\ f((1 - \lambda) x + \lambda y) &\le (1 - \lambda) f(x) + \lambda f(y) \end{aligned}\]Funkcija $f$ je torej konveksna.
Za poljubna $x, y \in K$ lahko torej zapišemo:
\[\begin{aligned} h_{x,y}(t) &= f((1 - t) x + ty) \\ &= f((1 - t) x_1 + ty_1, \dots, (1 - t) x_n + ty_n) \\[2ex] h'_{x,y}(t) &= {\partial f \over \partial x_1}((1 - t) x + ty) \cdot (y_1 - x_1) + \dots + {\partial f \over \partial x_n}((1 - t) x + ty) \cdot (y_n - x_n) \\ &= (\nabla f((1 - t) x + ty))^\top (y - x) \\[2ex] h''_{x,y}(t) &= {\partial^2 f \over \partial x_1 \partial x_1}((1 - t) x + ty) \cdot (y_1 - x_1)(y_1 - x_1) + \dots + {\partial^2 f \over \partial x_n \partial x_1}((1 - t) x + ty) \cdot (y_n - x_n)(y_1 - x_1) \\ &+ \dots \\ &+ {\partial^2 f \over \partial x_1 \partial x_n}((1 - t) x + ty) \cdot (y_1 - x_1)(y_n - x_n) + \dots + {\partial^2 f \over \partial x_n \partial x_n}((1 - t) x + ty) \cdot (y_n - x_n)(y_n - x_n) \\ &= \sum_{i=1}^n \sum_{j=1}^n {\partial^2 f \over \partial x_j \partial x_i}((1 - t) x + ty) \cdot (y_j - x_j)(y_i - x_i) \\ &= (y - x)^\top H_f((1 - t) x + ty) (y - x) \end{aligned}\]Velja torej:
\[\begin{aligned} \forall x, y \in K \ \forall t \in (-\epsilon, 1+\epsilon): h''_{x,y}(t) \ge 0 &\iff \forall x, y \in K \ \forall t \in (-\epsilon, 1+\epsilon): H_f((1 - t) x + ty) \ge 0 \\ &\iff \forall x \in K: H_f(x) \ge 0 \end{aligned}\]Opomba. Taylorjev razvoj funkcije več spremenljivk lahko zapišemo kot
\[f(y) = f(x) + (\nabla f(x))^\top (y - x) + {1 \over 2} (y - x)^\top H_f(x) (y - x) + \text{členi višjega reda}\]Trditev. Naj bo $K \subseteq \mathbb{R}^n$ konveksna množica, ter $f: K \to \mathbb{R}$ strogo konveksna funkcija. Če je $x^\ast \in K$ globalni maksimum funkcije $f$, potem je $x^\ast$ ekstremna točka za $K$.
Dokaz. Predpostavimo, da $x^\ast$ ni ekstremna točka, torej obstajajo $x, y \in K, \ x \ne y$ ter $\lambda \in (0, 1)$, da velja $x^\ast = (1 - \lambda) x + \lambda y$. Potem velja
\[f(x^\ast) = f((1 - \lambda) x + \lambda y) < (1 - \lambda) f(x) + \lambda f(y) \le (1 - \lambda) f(x^\ast) + \lambda f(x^\ast) = f(x^\ast),\]protislovje.
Funkcija $f$ ni strogo konveksna, saj za vse $\lambda \in (0, 1)$ velja
\[1 = f(1, \lambda) = f((1 - \lambda) (1, 0) + \lambda (1, 1)) = (1 - \lambda) f(1, 0) + \lambda f(1, 1) = 1\]Problem vezanih ekstremov z neenačbami (VEN) definiramo kot
\[\begin{aligned} \max / \min \ f(x) \\[1ex] \text{p.p.} \quad x &\in \Omega \\ g_1(x) &\le 0 \\ g_2(x) &\le 0 \\ &\vdots \\ g_m(x) &\le 0 \end{aligned}\]Množica dopustnih rešitev je torej
\[D = \lbrace x \in \Omega \mid \forall i \in \lbrace 1, 2, \dots, m \rbrace: g_i(x) \le 0 \rbrace.\]

</span>
Imamo torej:
\[\begin{aligned} \Omega &= \mathbb{R}^2 \\ y &\le 4 & y - 4 &\le 0 \\ y &\ge x^2 & x^2 - y &\le 0 \end{aligned}\]</span>
</span>
V notranjosti:
\[\begin{alignedat}{2} {\partial f \over \partial x}(x, y) &=&\ 6x^2 + 8x - 2y &= 0 \\ {\partial f \over \partial y}(x, y) &=&\ 2y - 2x &= 0 \Longrightarrow x = y \\ && 6x^2 + 6x &= 0 \\ && x(x+1) &= 0 \end{alignedat}\]Dobimo kandidata $x = y = 0$ in $x = y = -1$, ki pa nista v $\mathring{D}$ (relativna notranjost $D$).
Na zgornjem robu: $x \in (-2, 2)$, $y = 4$
\[\begin{gathered} \begin{aligned} g(x) &= f(x, 4) = 2x^3 + 4x^2 - 8x + 16 \\ g'(x) &= 6x^2 + 8x - 8 = 2(3x^2 + 4x - 4) = 0 \\ x &= {-4 \pm \sqrt{16 + 48} \over 6} = {-2 \pm 4 \over 3} \end{aligned} \\ \begin{aligned} x_1 &= -2 & f(-2, 4) &= 32 \quad \text{(ni v relativni notranjosti roba)} \\ x_2 &= {2 \over 3} & f\left({2 \over 3}, 4\right) &= {352 \over 27} \approx 13.037 \end{aligned} \end{gathered}\]Na spodnjem robu: $x \in (-2, 2)$, $y = x^2$
\[\begin{aligned} h(x) &= f(x, x^2) = x^4 + 4x^2 \\ h'(x) &= 4x^3 + 8x = 4x(x^2 + 2) = 0 \\ x &= 0 \quad \ \ f(0, 0) = 0 \end{aligned}\]Na stičiščih obeh robov: $x = \pm 2$, $y = 4$
\[f(-2, 4) = 32 \qquad f(2, 4) = 32\]Globalni maksimum je torej v $(\pm 2, 4)$, globalni minimum pa v $(0, 0)$.
Definirajmo Lagrangeevo funkcijo
\[L(x, y, \lambda) = 2x^3 + 4x^2 + y^2 - 2xy + \lambda (y - 4),\]kjer je $\lambda$ Lagrangeev množitelj (multiplikator).
Poiščimo parcialne odvode Lagrangeeve funkcije:
\[\begin{gathered} \begin{alignedat}{2} {\partial L \over \partial x} &= 6x^2 + 8x - 2y &&= 0 \\ {\partial L \over \partial y} &= 2y - 2x + \lambda &&= 0 \\ {\partial L \over \partial \lambda} &= y - 4 &&= 0 \end{alignedat} \\ y = 4 \qquad x = {-2 \pm 4 \over 3} \qquad \lambda = {-28 \pm 8 \over 3} \end{gathered}\]Sistem enačb ima rešitvi $(x, y, \lambda) = (-2, 4, -12)$ in $(x, y, \lambda) = \left({2 \over 3}, 4, -{20 \over 3}\right)$.
\[\begin{gathered} L(x, y, \mu) = 2x^3 + 4x^2 + y^2 - 2xy + \mu (x^2 - y) \\ \begin{alignedat}{2} {\partial L \over \partial x} &= 6x^2 + 8x - 2y + 2 \mu x &&= 0 \\ {\partial L \over \partial y} &= 2y - 2x - \mu &&= 0 \\ {\partial L \over \partial \mu} &= x^2 - y &&= 0 \\[2ex] y &= x^2 \\ \mu &= 2x^2 - 2x \\ 0 &= 4x^3 + 8x = 4x (x^2 + 2) \end{alignedat} \\ x = 0 \qquad y = 0 \qquad \mu = 0 \end{gathered}\]
</span>
\[\begin{alignedat}{2} f(x, y) &= 2x^3 + 4x^2 + y^2 - 2xy \\ \text{p.p.} \quad y - 4 &\le 0 \\ x^2 - y &\le 0 \\[2ex] L(x, y, \lambda, \mu) &= 2x^3 + 4x^2 + y^2 - 2xy &&+ \lambda (y - 4) + \mu (x^2 - y) \\ L_x := {\partial L \over \partial x} &= 6x^2 + 8x - 2y + 2 \mu x &&= 0 \\ L_y := {\partial L \over \partial y} &= 2y - 2x + \lambda - \mu &&= 0 \\ \end{alignedat}\]
</span>
Za problem vezanih ekstremov z neenačbami lahko torej zapišemo Lagrangeevo funkcijo
\[L(x_1, \dots, x_n, \lambda_1, \dots, \lambda_m) = f(x_1, \dots, x_n) + \sum_{i=1}^m \lambda_i g_i(x_1, \dots, x_n)\]Lokalni ekstremi so doseženi pri
\[\begin{align} L_j := {\partial L \over \partial x_j}(x_1, \dots, x_n, \lambda_1, \dots, \lambda_m) &= 0 & (1 \le j \le n) \\ \lambda_i g_i(x_1, \dots, x_n) &= 0 & (1 \le i \le m) \\ g_i(x_1, \dots, x_n) &\le 0 & (1 \le i \le m) \end{align}\]Ločimo na $2^m$ primerov glede na $g_i(x_1, \dots, x_n) = 0$ oziroma $g_i(x_1, \dots, x_n) < 0$ in posledično $\lambda_i = 0$ ($1 \le i \le m$).
</span>
Definicija. Vrednosti $x_1, \dots, x_n, \lambda_1, \dots, \lambda_m$ ustrezajo Karush-Kuhn-Tuckerjevim (KKT) pogojem za problem vezanega ekstrema z neenačbami, če velja
\[\begin{align} L_j := {\partial L \over \partial x_j}(x_1, \dots, x_n, \lambda_1, \dots, \lambda_m) &= 0 & (1 \le j \le n) \\ \lambda_i g_i(x_1, \dots, x_n) &= 0 & (1 \le i \le m) \\ g_i(x_1, \dots, x_n) &\le 0 & (1 \le i \le m) \\ \lambda_i &\ge 0 & (1 \le i \le m) \end{align}\]Ali so Karush-Kuhn-Tuckerjevi pogoji za $(x^\ast, \lambda^\ast)$ zadoščeni natanko tedaj, ko je $x^\ast$ globalni ekstrem?
</span>
Vseeno lahko najdemo točko, ki ustreza Karush-Kuhn-Tuckerjevim pogojem:
\[\begin{alignedat}{5} L(x, y, \lambda, \mu) &= x^2 - y^2 &&- \lambda x - \mu y \\ L_x &= 2x - \lambda &&= 0 & -\lambda x &= 0 &\qquad x &\ge 0 &\qquad \lambda &\ge 0 \\ L_y &= -2y - \mu &&= 0 & -\mu y &= 0 &\qquad y &\ge 0 &\qquad \mu &\ge 0 \\ x &= y = \lambda = \mu &&= 0 \end{alignedat}\]
\[\begin{aligned} \min \ x \\[1ex] \text{p.p.} \quad x, y &\in \mathbb{R} & (\Omega = \mathbb{R}^2) \\ 0 \le y &\le x^3 \end{aligned}\]
Globalni minimum je v točki $(x, y) = (0, 0)$.
\[\begin{alignedat}{4} L(x, y, \lambda, \mu) &= x - \lambda y +{} &\mu &(y - x^3) \\ L_x &= 1 - 3 \mu x^2 &&= 0 \\ L_y &= -\lambda + \mu &&= 0 & \\ -\lambda y &= 0 & y &\ge 0 &\qquad \lambda &\ge 0 \\ \mu (y - x^3) &= 0 & y &\le x^3 &\qquad \mu &\ge 0 \\[1ex] \lambda &= \mu\ne 0 & y &= x = 0 & 1 &= 0 & \rightarrow\!&\!\leftarrow \end{alignedat}\]</span>

</span>
</span>
Izrek. Naj bo $\Omega \subseteq \mathbb{R}^n$ odprta konveksna množica ter $f, g_1, g_2, \dots, g_m: \Omega \to \mathbb{R}$ konveksne odvedljive funkcije. Če $(x^\ast, \lambda^\ast) \in \Omega \times \mathbb{R}^m$ zadošča Karush-Kuhn-Tuckerjevim pogojem, potem je $x^\ast$ globalni minimum funkcije $f\vert_D$, kjer je $D = \lbrace x \in \Omega \mid \forall i \in \lbrace 1, 2, \dots, m \rbrace: g_i(x) \le 0 \rbrace$ (tj., $x^\ast$ je optimalna rešitev ustreznega problema vezanih ekstremov z neenačbami).
Opomba. Pri pogojih iz zgornjega izreka so torej Karush-Kuhn-Tuckerjevi pogoji zadostni za optimalnost rešitve.
Dokaz. Vzemimo poljuben $x \in D$. Zaradi konveksnosti (kriterij 1. odvoda) velja:
\[\begin{aligned} f(x) &\ge f(x^\ast) + (\nabla f(x^\ast))^\top (x - x^\ast) \\ \forall i \in \lbrace 1, 2, \dots, m \rbrace: \ g_i(x) &\ge g_i(x^\ast) + (\nabla g_i(x^\ast))^\top (x - x^\ast) \qquad / \cdot \lambda_i^\ast \\ \hline f(x) \ge f(x) + \sum_{i=1}^m \lambda_i^\ast g_i(x) &\ge f(x^\ast) + \sum_{i=1}^m \lambda_i^\ast g_i(x^\ast) + \left(\nabla f(x^\ast) + \sum_{i=1}^m \lambda_i^\ast \nabla g_i(x^\ast)\right)^\top (x - x^\ast) \\ &= f(x^\ast) + (\nabla L(x^\ast, \lambda^\ast))^\top (x - x^\ast) = f(x^\ast) \\ \end{aligned}\]</span>
Izrek. Naj bo $\Omega \subseteq \mathbb{R}^n$ odprta množica ter $f, g_1, g_2, \dots, g_m: \Omega \to \mathbb{R}$ funkcije, pri čemer je funkcija $f$ odvedljiva. Če je $x^\ast$ globalni minimum funkcije $f\vert_D$ za $D = \lbrace x \in \Omega \mid \forall i \in \lbrace 1, 2, \dots, m \rbrace: g_i(x) \le 0 \rbrace$ in velja vsaj eno od sledečega:
potem obstaja tak $\lambda^\ast \in \mathbb{R}^m$, da $(x^\ast, \lambda^\ast)$ ustreza Karush-Kuhn-Tuckerjevim pogojem.
Dokaz izpustimo. V dokazu se uporabi Farkaseva lema.
Opomba. Pri pogojih iz zgornjega izreka so torej Karush-Kuhn-Tuckerjevi pogoji potrebni za optimalnost rešitve.
</span>
Posledica. Naj bo $\Omega \subseteq \mathbb{R}^n$ odprta konveksna množica ter $f, g_1, g_2, \dots, g_m: \Omega \to \mathbb{R}$ konveksne odvedljive funkcije, tako da velja $\mathring{D} \ne \emptyset$. Potem je $x^\ast \in \Omega$ globalni minimum problema vezanih ekstremov z neenačbami natanko tedaj, ko obstaja tak $\lambda^\ast \in \mathbb{R}^m$, da $(x^\ast, \lambda^\ast)$ ustreza Karush-Kuhn-Tuckerjevim pogojem.
Opomba. Takemu problemu rečemo konveksni problem oziroma problem konveksne optimizacije.
\[\begin{aligned} \min \ x \\[1ex] \text{p.p.} \quad x, y &\in \mathbb{R} & (\Omega = \mathbb{R}^2) \\ 0 \le y &\le x^3 \end{aligned}\]
Globalni minimum je v točki $(x^\ast, y^\ast) = (0, 0)$, kjer pa Karush-Kuhn-Tuckerjevi pogoji niso izpolnjeni. Velja namreč:
\[\begin{aligned} g_1(x, y) &= -y & g_1(0, 0) &= 0 & \text{afina} \\ g_2(x, y) &= y - x^3 & g_2(0, 0) &= 0 & \text{ni afina} \\ H_{g_2}(x, y) &= \begin{bmatrix} -6x & 0 \\ 0 & 0 \end{bmatrix} \not\ge 0 & (\text{za } x &> 0) & \text{ni konveksna} \\ \nabla g_1(x, y) &= \begin{bmatrix} 0 \\ -1 \end{bmatrix} & \nabla g_2(x, y) &= \begin{bmatrix} -3x^2 \\ 1 \end{bmatrix} \\ \nabla g_1(0, 0) &= \begin{bmatrix} 0 \\ -1 \end{bmatrix} & \nabla g_2(0, 0) &= \begin{bmatrix} 0 \\ 1 \end{bmatrix} & \text{nista linearno neodvisna} \end{aligned}\]</span>
Trditev. Naj bo $K \subseteq \mathbb{R}^n$ konveksna množica, $f: K \to \mathbb{R}$ konveksna funkcija, ter $b \in \mathbb{R}$. Potem je množica $A = \lbrace x \in K \mid f(x) \le b \rbrace$ konveksna.
Dokaz. Vzemimo poljubne $x, y \in A$ ter $\lambda \in [0, 1]$. Potem velja
\[f((1 - \lambda) x + \lambda y) \le (1 - \lambda) f(x) + \lambda f(y) \le (1 - \lambda) b + \lambda b = b.\]Opomba. Če je množica $\Omega$ konveksna in so funkcije $g_1, g_2, \dots, g_m: \Omega \to \mathbb{R}$ konveksne ter $b \in \mathbb{R}^m$, potem je množica $\lbrace x \in \Omega \mid \forall i \in \lbrace 1, 2, \dots, m \rbrace: g_i(x) \le b_i \rbrace$ konveksna.
</span>
\[\begin{aligned} \min \ {1 \over x} + {2 \over y} \\[1ex] \text{p.p.} \quad x &> 0 \\ y &> 0 \\ x + y &\le 5 \\ 3x^2 + 2y^2 &\le 35 \end{aligned}\]
To je konveksni problem:
\[\begin{aligned} \Omega &= \lbrace (x, y) \in \mathbb{R}^2 \mid x > 0, y > 0 \rbrace & \text{konveksna,} &\ \text{odprta} \\ f(x, y) &= {1 \over x} + {2 \over y} & H_f(x, y) &= \begin{bmatrix} 2x^{-3} & 0 \\ 0 & 4y^{-3} \end{bmatrix} \ge 0 \\ g_1(x, y) &= x + y - 5 && \text{afina} \\ g_2(x, y) &= 3x^2 + 2y^2 - 35 & H_{g_2}(x, y) &= \begin{bmatrix} 6 & 0 \\ 0 & 4 \end{bmatrix} \ge 0 \end{aligned}\]</span>

</span>
</span>
$g_1(x, y) = x + y - 5 = 0$: $y = 5 - x$
\[\begin{alignedat}{3} L(x, 5 - x, \lambda, \mu) &= {1 \over x} + {2 \over 5 - x} + \mu (5x^2 - 20x &&+ 15) \qquad \\ \text{KKT:} \quad L_x &= -{1 \over x^2} + \lambda + 6 \mu x &&= 0 \\ L_y &= -{2 \over (5 - x)^2} + \lambda + 4 \mu (5 - x) &&= 0 \\ 0 &= \mu (5x^2 - 20x + 15) && \lambda, \mu \ge 0 \qquad 5x^2 - 20x + 15 \le 0 \end{alignedat}\]$g_2(x, 5 - x) = 0$: $x = 2 \pm 1$, $y = 3 \mp 1$
</span>
</span>
</span>
$g_2(x, 5 - x) < 0$, $\mu = 0$:
</span>
</span>
</span>
</span>
Primer. Uporabimo Karush-Kuhn-Tuckerjeve pogoje za linearni program $\Pi$.
\[\begin{aligned} \max \ c^\top x \\[1ex] \text{p.p.} \quad A x &\le b \\ x &\ge 0 \end{aligned}\]Zgornji linearni program zapišimo kot problem vezanega ekstrema z neenačbami.
\[\begin{aligned} \min \ -c^\top x \\[1ex] \text{p.p.} \quad x &\in \mathbb{R}^n \\ a_i^\top x - b_i &\le 0 & (1 &\le i \le m) \\ -x_j &\le 0 & (1 &\le j \le n) \end{aligned}\]Ciljna funkcija in vezi so konveksne, torej imamo konveksni problem.
</span>
Zapišimo Lagrangeevo funkcijo in Karush-Kuhn-Tuckerjeve pogoje.
\[\begin{alignedat}{3} L(x, \lambda, \mu) &= -c^\top x + \lambda^\top (A x -{} &{} b) &- \mu^\top x \\ &= -\sum_{j=1}^n c_j x_j \ + \ \sum_{i=1}^m &{} \lambda_i &\Big(\sum_{j=1}^n a_{ij} x_j &{} - \ b_i \Big) &- \sum_{j=1}^n \mu_j x_j \\ \text{KKT:} \quad L_j(x, \lambda, \mu) &= -c_j + \sum_{i=1}^n \lambda_i a_{ij} -{} &{} \mu_j &= 0 && (1 \le j \le n) \\ \nabla L(x, \lambda, \mu) &= -c + A^\top \lambda - \mu &&= 0 \\ \lambda^\top (A x - b) &= 0 & \lambda &\ge 0 & Ax - b &\le 0 \\ -\mu^\top x &= 0 & \mu &\ge 0 & -x &\le 0 \end{alignedat}\]
</span>
</span>
\[a = \begin{bmatrix} 20 \\ 60 \\ 100 \end{bmatrix} \qquad b = \begin{bmatrix} 2 \\ 4 \end{bmatrix} \qquad U = \begin{bmatrix} 8 & 10 \\ 5 & 30 \\ 5 & 20 \end{bmatrix}\]
Ali so cene $p = \begin{bmatrix} 18 \ 36 \end{bmatrix}$ ravnovesne?
\[\begin{aligned} 18 x_{11} + 36 x_{12} &= 20 & x_{12} &= {5 \over 9} - {1 \over 2} x_{11} \\ 18 x_{21} + 36 x_{22} &= 60 & x_{22} &= {5 \over 3} - {1 \over 2} x_{21} \\ 18 x_{31} + 36 x_{32} &= 100 & x_{32} &= {25 \over 9} - {1 \over 2} x_{31} \\ x_{11} + x_{21} + x_{31} &= 2 & x_{31} &= 2 - x_{11} - x_{21} \\ x_{12} + x_{22} + x_{32} &= 4 & {45 \over 9} - 1 &= 4 \end{aligned}\]</span>
\[\begin{aligned} 0 \le x_{11} &\le {10 \over 9} & 0 &\le x_{21} \le 2 & 0 &\le x_{31} \le 2 \\ u_1(X) &= 8 x_{11} + 10 x_{12} & u_2(X) &= 5 x_{21} + 30 x_{22} & u_3(X) &= 5 x_{31} + 20 x_{32} \\ &= 3x_{11} + {50 \over 9} &&= -10 x_{21} + 50 &&= -5 x_{31} + {500 \over 9} \\ x_{11} &= {10 \over 9} & x_{21} &= 0 & x_{31} &= 0 \ne 2 - x_{11} - x_{12} \\ u_1(X) &= {80 \over 9} & u_2(X) &= 50 && \rightarrow\!\leftarrow \end{aligned}\]
Pogoji niso kompatibilni, zato cene niso ravnovesne.
Vaja. Dokaži, da so cene $p = \begin{bmatrix} 10 \ 40 \end{bmatrix}$ ravnovesne.
</span>
Trditev. Če ravnovesne cene $p$ obstajajo, potem so pozitivne in $b^\top p = \mathbf{1}^\top a$ (tj., vse dobrine se prodajo za ves kapital na voljo).
</span>
Trditev. Naj bosta $p > 0$ in $X \ge 0$takšna, da velja $Xp = a$ in $X^\top \mathbf{1} = b$. Če vsak kupec kupuje samo iz svojega optimalnega svežnja (tj., $\forall i, j: \ (x_{ij} > 0 \Rightarrow j \in S_i)$), potem so cene $p$ ravnovesne.
Primer.
\[a = \begin{bmatrix} 20 \\ 60 \\ 100 \end{bmatrix} \qquad b = \begin{bmatrix} 2 \\ 4 \end{bmatrix} \qquad U = \begin{bmatrix} 8 & 10 \\ 5 & 30 \\ 5 & 20 \end{bmatrix}\]
</span>
Pokažimo, da so cene $p = \begin{bmatrix} 10 \ 40 \end{bmatrix}$ ravnovesne.
</span>
</span>
Če vsak kupec kupuje samo iz svojega optimalnega svežnja, potem velja $\forall i, j: \left(x_{ij} > 0 \Rightarrow z_i = z_{ij} = {u_{ij} \over p_j}\right)$. Za vsak $i$ torej velja
\[u_i(X) = \sum_{j=1}^n u_{ij} x_{ij} = \sum_{j=1}^n z_i p_j x_{ij} = z_i \sum_{j=1}^n p_j x_{ij} = z_i a_i.\]
</span>
Naj bo $X’ = (x_{ij}’)_{i,j=1}^{m,n}$ neka druga dopustna izbira kupljenih količin. Ker velja $\forall i, j: z_{ij} = {u_{ij} \over p_j} \le z_i$, za vsak $i$ sledi
\[u_i(X') = \sum_{j=1}^n u_{ij} x'_{ij} \le \sum_{j=1}^n z_i p_j x'_{ij} = z_i a_i = u_i(X).\]
</span>
Vrednosti $u_i(X)$ so torej optimalne za vsak $i$.
Vprašanji:
</span>
Pri Fisherjevem modelu trga želimo maksimizirati zadovoljstvo vseh kupcev.
</span>
Izkaže se, da je “prava” funkcija
\[\left(\prod_{i=1}^m u_i(X)^{a_i}\right)^{1 \over \sum_{i=1}^m a_i}.\]Trditev. Funkcija
\[f(X) = -\sum_{i=1}^m a_i \log(u_i(X))\]je konveksna.
Dokaz. Pišemo lahko $f = \sum_{i=1}^m a_i \cdot ((-\log) \circ u_i)$.
Zapišimo torej Eisenberg-Galeov konveksni program (EGP).
\[\begin{alignedat}{2} \min \ -\sum_{i=1}^m &\ a_i \log(u_i(X)) \\[1ex] \text{p.p.} \quad X \in \Omega &= \lbrace X \in \mathbb{R}^{m \times n} &&\mid \forall i \in \lbrace 1, 2, \dots, m \rbrace: u_i(X) > 0 \rbrace \\ \sum_{i=1}^m x_{ij} &\le 1 && (1 \le j \le n) \\ x_{ij} &\ge 0 && (1 \le i \le m, 1 \le j \le n) \end{alignedat}\]Opazimo:
</span>
Karush-Kuhn-Tuckerjevi pogoji so torej potrebni in zadostni za optimalnost rešitve.
Izrek. Eisenberg-Galeov konveksni program je dopusten in optimalen.
Naj bo
\[D = \left\lbrace X \in \Omega \mid \forall j \in \lbrace 1, 2, \dots, n \rbrace: \left(\sum_{i=1}^m x_{ij} \le 1 \land \forall i \in \lbrace 1, 2, \dots, m \rbrace: x_{ij} \ge 0\right)\right\rbrace\]množica dopustnih rešitev.
Za $\epsilon > 0$ definirajmo še množico
\[D_\epsilon = \lbrace X \in D \mid \forall i \in \lbrace 1, 2, \dots, m \rbrace: u_i(X) \ge \epsilon \rbrace.\]</span>
Da bo $\overline{X} \in D_\epsilon$, mora veljati
\[\forall i \in \lbrace 1, 2, \dots, m \rbrace: \ \epsilon \le u_i(\overline{X}) = {1 \over m} \sum_{j=1}^n u_{ij}.\]Poleg tega bomo zahtevali še
\[\forall h \in \lbrace 1, 2, \dots, m \rbrace: \ \epsilon \le e^{-{1 \over a_h}\left(f(\overline{X}) + \sum_{\substack{i = 1 \\ i \ne h}}^m a_i \log \left(\sum_{j=1}^n u_{ij}\right)\right)}.\]Naj bo $X \in D \setminus D_\epsilon$. Potem za nek $h_0$ velja $u_{h_0}(X) < \epsilon$. Z logaritmiranjem tako dobimo
\[\begin{aligned} \log(u_{h_0}(X)) &< -{1 \over a_{h_0}}\left(f(\overline{X}) + \sum_{\substack{i = 1 \\ i \ne h_0}}^m a_i \log \left(\sum_{j=1}^n u_{ij}\right)\right) \\ -a_{h_0} \log(u_{h_0}(X)) &> f(\overline{X}) + \sum_{\substack{i = 1 \\ i \ne h_0}}^m a_i \log\left(\sum_{j=1}^n u_{ij}\right) \end{aligned}\]
</span>
</span>
Ker za vsak $i$ velja $u_i(X) = \sum_{j=1}^n u_{ij} x_{ij} \le \sum_{j=1} u_{ij}$, velja tudi
\[-a_i \log(u_i(X)) \ge -a_i \log \left(\sum_{j=1}^n u_{ij}\right).\]Če k prejšnji neenakosti prištejemo zgornjo za vsak $i \ne h_0$, dobimo
\[f(X) = -\sum_{i=1}^m a_i \log(u_i(X)) > f(\overline{X})\]Zapišimo Karush-Kuhn-Tuckerjeve pogoje za Eisenberg-Galeov konveksni program:
\[\begin{alignedat}{3} L(X, p, \Lambda) &= \quad -\sum_{i=1}^m a_i & \log(u_i(X)) &+ \sum_{j=1}^n p_j \Big(\sum_{i=1}^m & x_{ij} &- 1\Big) - {} && \sum_{i=1}^m \sum_{j=1}^n \lambda_{ij} x_{ij} \\ L_{ij} := {\partial L \over \partial x_{ij}}(X, p, \Lambda) &= -a_i {u_{ij} \over u_i(X)} &{} + p_j - \lambda_{ij} &= 0 &&&& (1 \le i \le m, 1 \le j \le n) \\ p_j \left(\sum_{i=1}^m x_{ij} - 1\right) &= 0 & \sum_{i=1}^m x_{ij} &\le 1 & p_j &\ge 0 && (1 \le j \le n) \\ \lambda_{ij} x_{ij} &= 0 & x_{ij} &\ge 0 & \lambda_{ij} &\ge 0 && (1 \le i \le m, 1 \le j \le n) \end{alignedat}\]Izrek. Naj bosta $X \in \mathbb{R}^{m \times n}$ in $p \in \mathbb{R} ^m$. Sledeči trditvi sta ekvivalentni.
$X \in \Omega$ in $(X, p, \Lambda)$ zadošča Karush-Kuhn-Tuckerjevim pogojem, kjer $\Lambda = (\lambda_{ij})_{i,j=1}^{m,n} \in \mathbb{R}^{m \times n}$ ustreza
\[\lambda_{ij} = \begin{cases} 0 & \text{če $x_{ij} > 0$, in} \\ p_j - a_i {u_{ij} \over u_i(X)} & \text{če $x_{ij} = 0$} \end{cases}\](tj., $p$ so Lagrangeevi množitelji za vezi $\sum_{i=1}^m x_{ij} \le 1$ ($1 \le j \le n$)).
Če je $x_{ij} > 0$, potem je $\lambda_{ij} = 0$. Ker je $j \in S_i$, velja $u_{ij} = p_j z_i$, torej
\[L_{ij} = -a_i {u_{ij} \over u_i(X)} + p_j - \lambda_{ij} = -a_i {p_j z_i \over z_i a_i} + p_j = 0.\]Če je $x_{ij} = 0$, potem velja $L_{ij} = -a_i {u_{ij} \over u_i(X)} + p_j - \lambda_{ij} = 0$.
Nazadnje za vsak $i$ izpeljemo še
\[\begin{aligned} \sum_{j=1}^n a_i u_{ij} x_{ij} &= \sum_{j=1}^n p_j u_i(X) x_{ij} \\ a_i u_i(X) &= u_i(X) \sum_{j=1}^n p_j x_{ij} \end{aligned}\]</span>
Zapišimo še poenostavljene Karush-Kuhn-Tuckerjeve pogoje za Eisenberg-Galeov konveksni program:
\[\begin{aligned} a_i {u_{ij} \over u_i(X)} + \lambda_{ij} &= p_j & x_{ij} &\ge 0 && (1 \le i \le m, 1 \le j \le n) \\ \sum_{i=1}^m x_{ij} &= 1 & p_j &> 0 && (1 \le j \le n) \\ \lambda_{ij} x_{ij} &= 0 & \lambda_{ij} &\ge 0 && (1 \le i \le m, 1 \le j \le n) \end{aligned}\]S Karush-Kuhn-Tuckerjevimi pogoji dobimo sledečo rešitev:
\[p = \begin{bmatrix} {3 \over 2} \\ {3 \over 2} \end{bmatrix} \qquad X = \begin{bmatrix} 1 & {1 \over 3} \\ 0 & {2 \over 3} \end{bmatrix}\]Trdimo, da so tudi $p’ = \begin{bmatrix} 1 \ 2 \end{bmatrix}$ ravnovesne cene.
\[\begin{alignedat}{4} x'_{11} + 2 x'_{12} &= 2 &&& x'_{12} &= 1 \,-\, {1 \over 2} & x'_{11} \\ x'_{21} + 2 x'_{22} &= 1 &&& x'_{22} &= {1 \over 2} - {1 \over 2} & x'_{21} &= {1 \over 2} x'_{11} \\ x'_{11} + x'_{21} &= 1 &&& x'_{21} &= 1 - x'_{11} \\ x'_{12} + x'_{22} &= 1 &&& 0 &\le x'_{11} \le 1 \\ u_1(X') &= 2 x'_{11} &{} + 2 x'_{12} &= x'_{11} + 2 &\qquad u_2(X') &= x'_{21} + 2 & x'_{22} &= 1 \\ x'_{11} &= 1 & x'_{12} &= {1 \over 2} & x'_{21} &= 0 & x'_{22} &= {1 \over 2} \\ u_1(X') &= 3 &&& u_2(X') &= 1 \\ z'_1 &= 2 & S'_1 &= \lbrace 1 \rbrace & z'_2 &= 1 & S'_2 &= \lbrace 1, 2 \rbrace \end{alignedat}\]
</span>
Izkaže se, da so pri teh podatkih vse možne ravnovesne cene
\[\begin{gathered} \tilde{p} = \begin{bmatrix} \lambda \\ 3 - \lambda \end{bmatrix} \qquad \tilde{X} = \begin{bmatrix} 1 & {2 - \lambda \over 3 - \lambda} \\ 0 & {1 \over 3 - \lambda} \end{bmatrix} \qquad \left(\lambda \in \left[1, {3 \over 2}\right]\right) \\ u_1(\tilde{X}) = 4 - {2 \over 3 - \lambda} \qquad u_2(\tilde{X}) = {2 \over 3 - \lambda} \end{gathered}\]