๐ย Gradient: Directional Derivative
๐คย Concept of Gradient
๊ทธ๋ผ๋์ธํธ๋ ๋ค๋ณ์ ํจ์์ ๊ธฐ์ธ๊ธฐ๋ฅผ ๋ํ๋ด๋ ๋ฒกํฐ๋ฅผ ๋งํ๋ค. ๊ทธ๋ผ๋์ธํธ์ ์์๋ ํจ์์ ์กด์ฌํ๋ ๋ชจ๋ ๋ณ์๋ฅผ ๋์์ผ๋ก ํธ๋ฏธ๋ถํ ๊ฒฐ๊ณผ๋ก ๊ตฌ์ฑ๋๋๋ฐ, ์๋ฅผ ๋ค์ด ๋ณ์๊ฐ $x_1, x_2$ 2๊ฐ์ธ ๋ค๋ณ์ ํจ์ $f(x_1, x_2)$๊ฐ ์๋ค๊ณ ๊ฐ์ ํด๋ณด์. ๋ค๋ณ์ ํจ์ $f$์ ๊ทธ๋ผ๋์ธํธ๋ ์๋ ์์์ฒ๋ผ ํํํ ์ ์๋ค.
\[f'(x_1, x_2) = \begin{vmatrix} \frac{โf}{โx_1} \\ \frac{โf}{โx_2} \end{vmatrix}\]์ด๋ฌํ ๊ทธ๋ผ๋์ธํธ๋ ๋จธ์ ๋ฌ๋, ์์น ์ต์ ํ ํ๋ฌธ์์ ๋งค์ฐ ์ค์ํ ๊ฐ๋ ์ผ๋ก ๊ผฝํ๋ค. ๊ทธ๋ผ๋์ธํธ ๋ฒกํฐ๊ฐ ๊ฐ๋ฆฌํค๋ ๋ฐฉํฅ์ด ๋ฐ๋ก ๋ค๋ณ์ ํจ์๊ฐ ํน์ ์ง์ ์์ ๊ฐ์ฅ ๊ฐํ๋ฅด๊ฒ ์ฆ๊ฐํ๋ ๋ฐฉํฅ์ ๊ฐ๋ฆฌํค๊ธฐ ๋๋ฌธ์ด๋ค. ์ด์ฒ๋ผ ๊ทธ๋ผ๋์ธํธ๋ ํจ์์ ์ ๋ ฅ ๊ณต๊ฐ์ ๋ฐ๋ผ ํจ์๊ฐ ์ด๋ป๊ฒ ๋ณํํ๋์ง๋ฅผ ์๋ ค์ฃผ๋ ๊ธธ์ก์ด ์ญํ ์ ํ๊ธฐ ๋๋ฌธ์, ๊ทธ๋ผ๋์ธํธ ๋ฐฉํฅ์ ๋ฐ๋ผ ๋ณ์๊ฐ์ ํ๋ํ๋ค ๋ณด๋ฉด ํจ์์ ์ต๋๊ฐโข์ต์๊ฐ์ ๋๋ฌํ์ฌ ์ต์ ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๊ฒ ๋๋ค. ๊ทธ๋ ๋ค๋ฉด ์ ๊ทธ๋ผ๋์ธํธ ๋ฒกํฐ์ ๋ฐฉํฅ์ด ํน์ ์ง์ ์์ ํจ์๊ฐ ๊ฐ์ฅ ๊ฐํ๋ฅด๊ฒ ์ฆ๊ฐํ๋ ๋ฐฉํฅ์ ๋ํ๋ด๋ ๊ฒ์ผ๊น?? ํธ๋ฏธ๋ถ, ๋ํจ์ ์ ์ ๊ทธ๋ฆฌ๊ณ ๋ด์ ์ ํ์ฉํด ์ฆ๋ช ํ ์ ์๋ค.
๐ชช Proof of Gradient
Example of multivariate function
๊ทธ๋ผ๋์ธํธ ๋ฒกํฐ์ ๋ฐฉํฅ์ด ํจ์๊ฐ ๊ฐ์ฅ ๊ฐํ๋ฅด๊ฒ ์ฆ๊ฐํ๋ ๋ฐฉํฅ๊ณผ ์ผ์นํ๋ค๋ ๋ช ์ ๋ฅผ ์ฆ๋ช ํ๊ธฐ ์ํด ์ต๋จ ๊ฒฝ๋ก๋ก ์ฐ ์ ์์ ์ค๋ฅด๋ ๊ณผ์ ์ ๋ ์ฌ๋ ค๋ณด๋ ค ํ๋ค. ์ฐ๋ฆฌ๋ ํ์ฌ ์ด๋ณ์ ํจ์๋ก ์ ์๋๋ ์ฐ ์คํฑ ์ด๋๊ฐ, ์ $(x_1^0, x_2^0)$๋ฅผ ์ง๋๊ณ ์๋ค. ์ฐ ์ ์์ ์ต๋จ ๊ฒฝ๋ก๋ก ์ค๋ฅด๋ ค๋ฉด ์ด๋ป๊ฒ ํด์ผํ ๊น?? ๊ฐ์ฅ ๊ฒฝ์ฌ๊ฐ ๊ฐํ๋ฅธ ๊ธ๊ฒฝ์ฌ ์ง๋๋ฅผ ํฅํด ๋์๊ฐ๋ฉด ๋ ๊ฒ์ด๋ค. ํ์ง๋ง ์ฐ ์คํฑ์ ์๋ ์ฐ๋ฆฌ๊ฐ ์ด๋ ๋ฐฉํฅ์ด ๊ฐ์ฅ ๊ฐํ๋ฅธ ๊ธ๊ฒฝ์ฌ ์ง๋์ธ์ง ์ง๊ด์ ์ผ๋ก ์ ๊ธธ์ด ์๋ค. ๊ทธ๋์ ๋ฐฉํฅ ๋ํจ์๋ฅผ ๋์ ํด ๊ธ๊ฒฝ์ฌ ์ง๋๋ก ํฅํ ์ ์๋ ๋ฐฉํฅ์ ๊ตฌํด ๋ณด๊ธฐ๋ก ํ๋ค. ์๋ ์์์ ๋ณด์.
\[\lim_{\Delta{x}->0}\frac{f(x+\Delta{x}) - f(x)}{\Delta{x}} = \frac{df}{dx}= f'(x) \\ df = f'(x)dx\]๋๋ฌด๋๋ ์ต์ํ ํํ ์๋๊ฐ?? ์ฐ๋ฆฌ๊ฐ ์ผ๋ฐ์ ์ผ๋ก ์๊ณ ์๋ ์ผ๋ณ์ ํจ์์ ๋ฏธ๋ถ ์ ์ ๊ทธ๋ฆฌ๊ณ ์ข๋ณ์ $dx$๋ฅผ ์ฐ๋ณ์ผ๋ก ๋๊ฒจ ์ด์ง ๋ณํํ ์์ด๋ค. ์ด๊ฒ์ ์ด์ ๋ค๋ณ์ ํจ์์ ์ ์ฉํ๋ฉด ๋ฐ๋ก ๋ฐฉํฅ ๋ํจ์๊ฐ ๋๋ค. ๋ค์ ์ฐ๋ฆฌ๊ฐ ์ค๋ฅด๋ ค๋ ์ฐ(์ด๋ณ์ ํจ์)์ผ๋ก ๋์์ ๋ณด์.
\[f(x_1 + dx_1, x_2) = f(x_1, x_2) + f'(x_1, x_2)dx_1 \\ f(x_1, x_2 + dx_2) = f(x_1, x_2) + f'(x_1, x_2)dx_2 \\\]์์์ ์์ ํ ๋ํจ์ ์ ์๋ฅผ ํ์ฉํด ์ฐ๋ฆฌ๊ฐ ๋ค์์ ๋ฐ๊ฑธ์์ ์ฎ๊ธธ ์์น๋ฅผ ์ $A$๋ฅผ $(x_1^0 + dx_1, x_2^0+dx_2)$ ์ด๋ผ๊ณ ํํํ ์ ์๋ค. ์ด ํํ์ ํ์ฉํด ๋ค๋ณ์ ํจ์์ ๋ฏธ๋ถ์ ์ ์ํด๋ณด์. ์ฐ๋ฆฌ๋ ์ด๋ฏธ ๋ค๋ณ์ ํจ์์ ๊ฐ๋ณ ๋ณ์์ ํธ๋ฏธ๋ถ์ ์ทจํ๊ณ ํ๋ฒกํฐ๋ก ์์ ๊ฒฐ๊ณผ๊ฐ ๋ฐ๋ก ์ ๋ฏธ๋ถ์ด๋ผ๋ ๊ฒ์ ์๊ณ ์๋ค.
\[f(x_1 + dx_1, x_2 + dx_2) - f(x_1, x_2) = f'(x_1)dx_1 + f'(x_2)dx_2\]๋ค์ ํธ๋ฏธ๋ถ์ ์ ์๋ฅผ ํ์ฉํด ์์์ ์ ๋ฆฌํ๋ฉด ๋ฐฉํฅ ๋ฒกํฐ์ ํธ๋ฏธ๋ถ ๊ฒฐ๊ณผ์ ๋ด์ ์ผ๋ก ํํํ ์ ์๋ค.
\[dL = \frac{โL}{โ{x_1}}dx_1 + \frac{โL}{โ{x_2}}dx_2 \\ dL = [dx_1, dx_2]\ โข\ \begin{vmatrix} \frac{โL}{โx_1} \\ \frac{โL}{โx_2} \end{vmatrix}\]์์์ง๋ ์์ ์์ ์ฐ๋ฆฌ์ ๋ณธ๋ ๋ชฉ์ ์ ์์ด์๋ ์๋๋ค. ์ฐ๋ฆฌ๋ ์ง๊ธ ๊ฐ์ฅ ๋น ๋ฅด๊ฒ ์ฐ ์ ์์ ๋๋ฌํ ์ ์๋ ๋ฐฉ๋ฒ์ ์ฐพ๊ธฐ ์ํด ์ง๊ธ๊น์ง ๋ฌ๋ ค์๋ค. ์ฐ ์ ์์ ๊ฐ์ฅ ๋น ๋ฅด๊ฒ ๋๋ฌํ๊ธฐ ์ํด ๊ฐ์ฅ ๊ฐํ๋ฅธ ๊ธ๊ฒฝ์ฌ ์ง๋๋ง ์ฐพ์์ ์ฌ๋ผ๊ฐ๋ ์ ๋ต์ ์ธ์ ์๋ค. ๋ค์ ๋งํด, ๋ค๋ณ์ ํจ์ $f(x)$์ ๊ทน์ ๋ณํ๋ $dL$์ด ์ต๋๊ฐ ๋๋ ๋ฐฉํฅ์ผ๋ก ๋ฐ๊ฑธ์์ ์ฎ๊ธฐ๋ฉด ๋๋ค๋ ๊ฒ์ด๋ค. ๊ทธ๋ ๋ค๋ฉด ๊ทน์ ๋ณํ๋ $dL$์ ์ธ์ ์ต๋๊ฐ ๋ ๊น??
์ด์ ๊น๋จน๊ณ ์์๋ ๋ด์ ์ ๊ฐ๋
์ ๋ค์ ํ ๋ฒ ์๊ธฐ์์ผ๋ณด์. ๋ด์ ์ ๋ค์ํ๊ฒ ํด์๋์ง๋ง, ๋ณธ๋ ์๋ก ๋ค๋ฅธ ๋ ๋ฒกํฐ์ ๋ฎ์ ์ ๋
๋ฅผ ๋ํ๋ธ๋ค. ๊ทน์ ๋ณํ๋ $dL$์ด ์ต๋๊ฐ ๋๋ ค๋ฉด ์ฐ๋ณ์ ๋ด์ ๊ฒฐ๊ณผ๊ฐ ์ต๋๊ฐ ๋์ด์ผ ํ๋ค. ๋ด์ ์ ์ต๋๊ฐ์ ์๋ก ๋ค๋ฅธ ๋ ๋ฒกํฐ ์ฌ์ด์ ๋ผ์ธ๊ฐ๋๊ฐ 0ห์ผ ๋ ์ฆ, ๋ ๋ฒกํฐ๊ฐ ๋์ผํ ๋ฐฉํฅ์ ๋ํ๋ผ ๋ ์ ์๋๋ค. ๋ฐ๋ผ์ ๋ฐฉํฅ ๋ฒกํฐ๊ฐ ๊ทธ๋ผ๋์ธํธ(ํธ๋ฏธ๋ถ์ ํ๋ฒกํฐ) ๋ฐฉํฅ์ผ ๋ ๋ด์ ๊ฒฐ๊ณผ
(๊ทน์ ๋ณํ๋ $dL$)๊ฐ ์ต๋๊ฐ ๋๋ค.
ํํธ, ์ค์ ๊ธฐ๊ณํ์ต์์๋ ์์คํจ์์ ์ต์ ํ๋ฅผ ๋ชฉ์ ํจ์๋ก ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ๊ทธ๋ผ๋์ธํธ(์์คํจ์์ ์ ๋ฏธ๋ถ) ๋ฐฉํฅ์ ์์๋ฅผ ์ทจํด์ค ๊ฐ์ ์ฌ์ฉํ๊ฒ ๋๋ค.
Leave a comment