๐๏ธ Convex Optimization Problem
โย Convex Optimization Problem
\[f(wx_1 + (1-w)x_2)โค wf(x_1) + (1-w)f(x_2),\ \ w \in [0,1] \\
f''(x) โฅ 0\]
Convex Problem
์ด๋, ๋ชฉ์ ํจ์ $f(x)$๊ฐ Convex Function
์ด๋ฉด์ Feasible Set
์ญ์ Convex Set
์ด ๋๋ ๋ฌธ์ ์ํฉ์ ์ผ์ปซ๋๋ค. Convex Problem
๋ ์ํ์ ์ต์ ํ์์ ๋งค์ฐ ์ค์ํ ๊ฐ๋
์ธ๋ฐ, ๊ทธ ์ด์ ๋ ํด๋น ์กฐ๊ฑด์ ๋ง์กฑํ๋ฉด ๊ตญ์ ์ต์ ํด
๊ฐ ์ ์ญ ์ต์ ํด
์ ๋์น๊ฐ ๋์ด ์ต์ ํ ๋์ด๋๊ฐ ๊ธ๊ฒฉํ ๋ฎ์์ง๊ธฐ ๋๋ฌธ์ด๋ค. ๋ํ Convex Problem
์ ํด๊ฒฐํด ๊ตญ์ ์ต์ ํด๋ฅผ ๊ตฌํ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ด๋ฏธ ๋ง์ด ๊ฐ๋ฐ ๋์ด ์๊ธฐ ๋๋ฌธ์ ์ฃผ์ด์ง ์ต์ ํ ๋ฌธ์ ๋ฅผ Convex Problem
์ผ๋ก ์นํํด ํด๊ฒฐํ๋๊ฒ ๊ฐ์ฅ ํจ์จ์ ์ด๋ค. ํํธ, ์ฌ๊ธฐ์ Feasible Set
์ด๋, ํจ์์ ์คํ ๊ฐ๋ฅ ์์ญโข์ ์์ญ
์ด๋ผ๊ณ ์๊ฐํ๋ฉด ๋๋ค. ์๋ ๊ทธ๋ฆผ, ๋นจ๊ฐ ์ง์ ์ ์์ญ์ ํด๋นํ๋ค. ์ธํธ๋ผ๋ ๋ช
์นญ์ ๋ฌดํํ ์ง์ ์ด ์๋ ์ ํํ ์ ๋ถ์ ํํํ๋ ์ฉ์ด๋ผ๊ณ ์๊ฐํ๋ฉด ๋๋ค.
์์ ์์ ํ ๋๊ฐ์ ์์์ ์ด๋ค ๋ฌธ์ ์ํฉ์ด Convex Problem
์ธ์ง ์๋์ง ๊ตฌ๋ถํด์ฃผ๋ ํ๋ณ์์ ์ญํ ์ ํ๋ค. ์ ๋ ์์์ ๋ง์กฑํ๋ฉด Convex Problem
์ด ๋๋์ง ์ดํด๋ณด๊ณ ๋ง์ง๋ง์๋ Convex Problem
์์ ์ ๊ตญ์ ์ต์ ํด
๊ฐ ์ ์ญ ์ต์ ํด
์ ๋์น๊ฐ ๋๋์ง ๊ทธ ์ฆ๋ช
์ ํด๋ณด๋ ค ํ๋ค.
๏นค Jensenโs Inequality
์ฒซ๋ฒ์งธ ์์์ ๋ณด์. ์ฐ๋ฆฌ๋ ์ด๊ฒ์ ์์ผ ๋ถ๋ฑ์
์ด๋ผ๊ณ ๋ถ๋ฅธ๋ค. ์์ผ ๋ถ๋ฑ์
์ ์ด๋ค ํจ์ $f(x)$์ Convex Function
์ฌ๋ถ๋ฅผ ํ์ ํ๋๋ฐ ์ฌ์ฉ๋๋ค. ์ข๋ณ์ Feasible Set
์ ํด๋น๋๋ ๋ฐ์ดํฐ ํฌ์ธํธ์ ํจ์๊ฐ์ ์๋ฏธํ๋ฉฐ ๊ทธ๋ฆผ ์์์ ์ด๋ก์ ๊ณก์ ์ผ๋ก ํํ๋๋ค. ํํธ, ์ฐ๋ณ์ Feasible Set
์ ํ๊ท ๋ณํ์จ์ ๊ธฐ์ธ๊ธฐ๋ก ํ๋ฉด์ ๊ตฌ๊ฐ ์์ชฝ ๋์ ์ง๋๋ ์ ๋ถ์ ์ผ์ปซ๋๋ค. ๊ทธ๋ฆผ์์ ํ๋์ ์ง์ ์ด ๋ฐ๋ก ๋ถ๋ฑ์์ ์ฐ๋ณ์ด๋ค.
๊ทธ๋ ๋ค๋ฉด ์ ๋ถ๋ฑ์์ ํญ์ ๋ง์กฑํ๋ ค๋ฉด ํจ์ $f(x)$๋ ์ด๋ค ํํ๋ฅผ ๊ฐ์ ธ์ผ ํ ๊น?? ๋จผ์ ์ค๋ชฉ ํจ์์ธ Concave Function
๋ถํฐ ์๊ฐํด๋ณด์. ์ ๊ทธ๋ฆผ์ ๋ค์ง์ด์ ์๊ฐํด๋ณด๋ฉด ๋๋๋ฐ, ํจ์๊ฐ ์ ์๋๋ ์ ์ฒด ์ ์์ญ์์ ์ ๋ถ๋ฑ์์ ๋ง์กฑํ๋ ๊ตฌ๊ฐ(ํ๋์ ์ง์ ์ด ์ด๋ก์ ๊ณก์ ๋ณด๋ค ์์ ์๋)์ ์ ํ ์ฐพ์๋ณผ ์ ์๋ค. ๋ฐ๋ผ์ ์์ผ ๋ถ๋ฑ์์ ๋ง์กฑํ๋ ค๋ฉด Feasible Set
์ ๊ตฌ๊ฐ์ด ๋ฐ๋์ Convex Set
์ด์ด์ผ ํ๊ณ , ํด๋น ๊ตฌ๊ฐ์์ ๋ชฉ์ ํจ์๋ ๋ฐ๋์ Convex Function
์ ํํ๋ฅผ ๋๊ณ ์์ด์ผ ํ๋ค.
๊ทธ๋ ๋ค๋ฉด ๋ชฉ์ ํจ์๊ฐ Convex
์ธ์ง๋ ์ด๋ป๊ฒ ํ๋ณํ ์ ์์๊น?? ์ฃผ์ด์ง ๋ชจ๋ ์ํฉ์์ ์ ๊ทธ๋ฆผ์ฒ๋ผ ์ฝ๊ฒ ํจ์์ ๊ทธ๋ํ๋ฅผ ๊ทธ๋ฆด ์๋ ์์ ๊ฒ์ด๋ค. ๊ทธ๋์ ์์์ผ๋ก ์ด๋ค ๋ชฉ์ ํจ์๊ฐ Convex
์ธ์ง ํ๋ณํ ์ ์์ด์ผ ํ๋ค. ๋๋์ด ์ ์๋ ๋๋ฒ์งธ ์์์ ํ์ฉํ ์ฐจ๋ก๋ค.
๐ย Second Derivative
๋๋ฒ์งธ ์์์ ํํ ์ด๊ณ๋ํจ์๋ผ๊ณ ๋ถ๋ฅธ๋ค. ์๋ง ์๋ฅ ์ํ์์ 21, 30๋ฒ๊ณผ ๊ฐ์ ํฌ๋ฌ ๋ฌธ์ ๋ฅผ ํ ๋ ๊ฐ๋์ฉ ์ฌ์ฉํ๋ ๊ธฐ์ต์ด ๋ ๊ฒ์ด๋ค. ์ด๊ณ๋ํจ์๋ ๋ํจ์๋ฅผ ํ ๋ฒ ๋ ๋ฏธ๋ถํ ๊ฒ์ผ๋ก ์ํจ์์ ๊ณก์ ์ด ์ผ๋ง๋ ๋น ๋ฅด๊ฒ ๋ณํ๋์ง ํน์ ๊ณก์ ์ ๊ณก๋ฅ ์ ๋ํ ์ ๋ณด๋ฅผ ์๋ ค์ค๋ค. ์ด๋ฅผ ํตํด ์ํจ์์ ๊ทน๋, ๊ทน์๋ ๋ฌผ๋ก ๋ณ๊ณก์ ์ ์์น๋ฅผ ์์๋ผ ์ ์๋ค. ๊ทธ๋์ ์ด๋ค ์ด์ฐจํจ์๋ฅผ ์์๋ก ๋ค์ด๋ณด์. 2์ฐจํญ์ ๋ถํธ๊ฐ ์์๋ผ๋ฉด ์ด๊ณ๋ํจ์์ ๊ฐ์ ํญ์ ์์๊ฐ ๋ ๊ฒ์ด๊ณ , ์์๋ผ๋ฉด ํญ์ ์์๊ฐ ๋ ๊ฒ์ด๋ค. ๊ทธ๋ฐ๋ฐ ์ฐ๋ฆฌ๋ ์ด๋ฏธ ์ง๊ด์ ์ผ๋ก 2์ฐจํจ์์์ ์ต๊ณ ์ฐจํญ์ ๋ถํธ๊ฐ ์์๋ฉด ์๋๋ก ๋ณผ๋กํ ํจ์, ๋ฐ๋์ ๊ฒฝ์ฐ ์๋ก ์ค๋ชฉํ ์ค๋ชฉํจ์๊ฐ ๋๋ค๋ ๊ฒ์ ์๊ณ ์๋ค. ๋ฐ๋ผ์ ์ด๊ณ๋ ํจ์์ ๊ฐ์ด ํญ์ ์์๋ผ๋ฉด ํด๋น ํจ์๋ Convex Function
์ด ๋๋ค.
์ง๊ธ๊น์ง๋ ๋จ๋ณ์ ํจ์์ ๋ํ ์ผ์ด์ค๋ง ์ดํด๋ณด์๋ค. ๊ทธ๋ ๋ค๋ฉด ์ด๊ฒ์ ๋ค๋ณ์๋ก ํ์ฅํ ์๋ ์์๊น?? ๋ฌผ๋ก ๊ฐ๋ฅํ๋ค. ์ด๋ค ๋ค๋ณ์ ํจ์๊ฐ Convex
์ธ์ง ํ์ ํ๋ ๊ฒ๋ ์์ ๋์ผํ ์กฐ๊ฑด์ ํตํด ํ๋ณํ๋ค. ์ด ๋ ๋ฑ์ฅํ๋๊ฒ ๋ฐ๋ก ํค์์ ํ๋ ฌ์ด๋ค. ํค์์ ํ๋ ฌ์ด๋, ์ด๋ค ๋ค๋ณ์ ํจ์์ ์ด๊ณ๋ํจ์๊ฐ์ ํ๋ ฌ๋ก ๋ํ๋ธ ๊ฒ์ด๋ค. ๋จ๋ณ์ ํจ์์ ์ด๊ณ๋ํจ์ ์ญํ ๊ณผ ๋์ผํ๋ค. ๊ทธ๋์ ์ด๋ค ๋ค๋ณ์ ํจ์๊ฐ ์ปจ๋ฐฑ์ค ํจ์์ด๋ ค๋ฉด, ํค์์ ํ๋ ฌ์ด Positive Semi-Define
์กฐ๊ฑด์ ๋ง์กฑํด์ผ ํ๋ค. ํค์์ ํ๋ ฌ๊ณผ Positive Semi-Define
์ ๋ํด์๋ ๋ค๋ฅธ ํฌ์คํธ์์ ์์ธํ ๋ค๋ฃจ๋๋ก ํ๊ฒ ๋ค.
๐ชช Proof: local minimum same as global minimum in Convex
์ด์ ๋๋์ด ๋ชฉ์ ํจ์๊ฐ ์ปจ๋ฐฑ์ค ํจ์์ผ ๋, ๊ตญ์ ์ต์ ํด๊ฐ ์ ์ญ ์ต์ ํด์ ๋์น๊ฐ ๋๋์ง๋ฅผ ์ฆ๋ช ํด๋ณด๋ ค ํ๋ค. ๋จผ์ ์ฆ๋ช ์ ๊ท๋ฅ๋ฒ์ ์ฌ์ฉํ๋ค. ๊ท๋ฅ๋ฒ์ด๋, ์ํ, ๋ ผ๋ฆฌํ, ์ฒ ํ ๋ฑ์์ ์ฃผ์ฅ์ด ๋ถ์ ๋จ์ ๋ณด์ด๊ธฐ ์ํด ๋ชจ์ ๋๋ ๋ถ์ ๋ ๊ฐ์ ์ ์ ๋ํ๋ ๋ ผ์ฆ ๊ธฐ๋ฒ์ผ๋ก, ํน์ ์ฃผ์ฅ์ด ์ฐธ์์ ์ฆ๋ช ํ๊ธฐ๋ณด๋ค๋ ๊ทธ ๋ฐ๋์ธ ๋ถ์ ๋ ์ฃผ์ฅ์ด ๊ฑฐ์ง์์ ๋ณด์ด๋ ๋ฐ ์ฌ์ฉํ๋ค. ๊ทธ๋์ ๊ท๋ฅ๋ฒ์ ํ์ฉํด ๋ค์๊ณผ ๊ฐ์ ๋ช ์ ๊ฐ ๊ฑฐ์ง์์ ์ฆ๋ช ํด๋ณด๋ ค ํ๋ค.
์ด๋ค ํจ์ $f(x)$๋ Convex๋ฉด์ Feasible Set์ด Convex Set์์ ๋ง์กฑํ๋ ๋์์ ์๋ ์์์ ๋ง์กฑํ๋ค๊ณ ํ๋ค.
\[f(x^@) < f(x^!)\]๋ถ๋ฑ์์ ์ฐ๋ณ์ ๊ตญ์ ์ต์ ํด๋ฅผ ์๋ฏธํ๊ณ , ์ข๋ณ์ ๊ตญ์ ์ต์ ํด๋ณด๋ค ์์ ํจ์๊ฐ์ด ์กด์ฌํ๋ค๊ณ ๊ฐ์ ํ ๊ฒ์ด๋ค. ์ด์ ์ด ๋ช ์ ๊ฐ ํ๋ฆผ์ ์ฆ๋ช ํ๋ฉด ์ฐ๋ฆฌ๋ ์์ฐ์ค๋ฝ๊ฒ ๊ตญ์ ์ต์ ํด๊ฐ ์ ์ญ ์ต์ ํด์ ๋์น๊ฐ ๋๋ค๋ ๊ฒ์ ํ์ธํ ์ ์๊ฒ ๋๋ค.
์ฐ๋ฆฌ๋ ํจ์ $f(x)$๊ฐ Convex
๋ฉด์ Feasible Set
์ด Convex Set
์ด๋ผ๊ณ ๊ฐ์ ํ๊ธฐ ๋๋ฌธ์, $\alpha x^! + (1-\alpha)x^@$ ์ญ์ Feasible Set
์ด ๋ ๊ฒ์ด๋ค. ์ด๋ฌํ ์ฌ์ค์ ํ์ฉํด ๋ ์ ($x^!, x^@$)์ ์์ผ ๋ถ๋ฑ์์ ๋ฃ์ด๋ณด์.
์ฐ๋ณ๋ถํฐ ํจ๊ป ์ดํด๋ณด์. $(1-w)$๋ ๋ฐ๋์ ์์๊ฐ ๋๋ค. ์์ผ ๋ถ๋ฑ์ ์ ์์ $w \in [0,1]$์ ๋ง์กฑํ๊ธฐ ๋๋ฌธ์ด๋ค. ํํธ, $f(x^@) -f(x^!)$๋ ์์๊ฐ ๋๋ค. ์ฆ๋ช ์ ์์ํ๋ฉด์ $f(x^@)$๊ฐ $f(x^!)$๋ณด๋ค ์๋ค๊ณ ๊ฐ์ ํ๊ธฐ ๋๋ฌธ์ด๋ค. ๋ฐ๋ผ์ ์ฐ๋ณ์ $f(x^!)$๋ณด๋ค ์์ฃผ ์กฐ๊ธ ์์ ๊ฐ(wโ1)์ด ๋ ๊ฒ์ด๋ค. ์ด์ ์ข๋ณ์ ์ดํด๋ณด์. ๋ง์ฐฌ๊ฐ์ง๋ก wโ1์ ํด์ฃผ๋ฉด ์ข๋ณ์ $f(x^!)$์ ๋งค์ฐ ๊ทผ์ ํ ์์น์ ํจ์๊ฐ์ ๋ณด์๋ ์๋ฏธ๊ฐ ๋๋ค. ์ข๋ณ์ $\alpha$, ์ฐ๋ณ์ $\beta$๋ก ์นํํด ์ง๊ธ๊น์ง ์ฆ๋ช ๊ณผ์ ์ ๋ค์ ๋ถ๋ฑ์์ผ๋ก ํํํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
\[\alpha โค \beta < f(x^!)\]์ฐ๋ฆฌ๋ $f(x^!)$๊ฐ ์ง์ญ ์ต์๊ฐ์ด๋ผ๊ณ ์ ์ํ ๋ฐ ์๋ค. ์ง์ญ ์ต์๊ฐ์ด๋ผ๋ ๊ฒ์ ๊ทธ ์ฃผ๋ณ์์ ๊ฐ์ฅ ์์๊ฐ์ด๋ผ๋ ์๋ฏธ๋ฅผ ๊ฐ๋๋ค. ๊ทธ๋ฐ๋ฐ $f(x^!)$์ ์ฃผ๋ณ๊ฐ์ธ $\alpha$๊ฐ ์ง์ญ ์ต์๊ฐ๋ณด๋ค ์๋ค๊ณ ๋ถ๋ฑ์์ ๋งํ๊ณ ์๊ธฐ ๋๋ฌธ์, ์ง์ญ ์ต์๊ฐ ์ ์์ ์๋ฐฐ๋์ด ์ ๋ช ์ ๋ ๊ฑฐ์ง์ด ๋๋ค.
์ ๋ฆฌํ์๋ฉด, ์ด๋ค ํจ์ $f(x)$๊ฐ ์ปจ๋ฐฑ์ค ์ฑ์ง์ ๋ง์กฑํ๋ฉด์, Feasible Set ์ญ์ Convex Set์ธ ๊ฒฝ์ฐ์ ๊ตญ์ ์ต์๊ฐ์ด ์ ์ญ ์ต์๊ฐ์ด ์๋ ๊ฒฝ์ฐ, ๊ตญ์ ์ต์ ์ด ๊ตญ์ ์ต์ ์ด ์๋ ๊ฒฝ์ฐ๊ฐ ๋ฐ์ํ๊ธฐ ๋๋ฌธ์ ๋ฐ๋์ ์ ์กฐ๊ฑด์์ ๊ตญ์ ์ต์ ๊ฐ์ ์ ์ญ ์ต์ ๊ฐ์ด ๋์ด์ผ ํ๋ค.
Leave a comment