Updated:

๐Ÿค”ย Concept of Gradient

๊ทธ๋ผ๋””์–ธํŠธ๋Š” ๋‹ค๋ณ€์ˆ˜ ํ•จ์ˆ˜์˜ ๊ธฐ์šธ๊ธฐ๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ๋ฒกํ„ฐ๋ฅผ ๋งํ•œ๋‹ค. ๊ทธ๋ผ๋””์–ธํŠธ์˜ ์›์†Œ๋Š” ํ•จ์ˆ˜์— ์กด์žฌํ•˜๋Š” ๋ชจ๋“  ๋ณ€์ˆ˜๋ฅผ ๋Œ€์ƒ์œผ๋กœ ํŽธ๋ฏธ๋ถ„ํ•œ ๊ฒฐ๊ณผ๋กœ ๊ตฌ์„ฑ๋˜๋Š”๋ฐ, ์˜ˆ๋ฅผ ๋“ค์–ด ๋ณ€์ˆ˜๊ฐ€ $x_1, x_2$ 2๊ฐœ์ธ ๋‹ค๋ณ€์ˆ˜ ํ•จ์ˆ˜ $f(x_1, x_2)$๊ฐ€ ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•ด๋ณด์ž. ๋‹ค๋ณ€์ˆ˜ ํ•จ์ˆ˜ $f$์˜ ๊ทธ๋ผ๋””์–ธํŠธ๋Š” ์•„๋ž˜ ์ˆ˜์‹์ฒ˜๋Ÿผ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค.

\[f'(x_1, x_2) = \begin{vmatrix} \frac{โˆ‚f}{โˆ‚x_1} \\ \frac{โˆ‚f}{โˆ‚x_2} \end{vmatrix}\]

์ด๋Ÿฌํ•œ ๊ทธ๋ผ๋””์–ธํŠธ๋Š” ๋จธ์‹  ๋Ÿฌ๋‹, ์ˆ˜์น˜ ์ตœ์ ํ™” ํ•™๋ฌธ์—์„œ ๋งค์šฐ ์ค‘์š”ํ•œ ๊ฐœ๋…์œผ๋กœ ๊ผฝํžŒ๋‹ค. ๊ทธ๋ผ๋””์–ธํŠธ ๋ฒกํ„ฐ๊ฐ€ ๊ฐ€๋ฆฌํ‚ค๋Š” ๋ฐฉํ–ฅ์ด ๋ฐ”๋กœ ๋‹ค๋ณ€์ˆ˜ ํ•จ์ˆ˜๊ฐ€ ํŠน์ • ์ง€์ ์—์„œ ๊ฐ€์žฅ ๊ฐ€ํŒŒ๋ฅด๊ฒŒ ์ฆ๊ฐ€ํ•˜๋Š” ๋ฐฉํ–ฅ์„ ๊ฐ€๋ฆฌํ‚ค๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ์ด์ฒ˜๋Ÿผ ๊ทธ๋ผ๋””์–ธํŠธ๋Š” ํ•จ์ˆ˜์˜ ์ž…๋ ฅ ๊ณต๊ฐ„์„ ๋”ฐ๋ผ ํ•จ์ˆ˜๊ฐ€ ์–ด๋–ป๊ฒŒ ๋ณ€ํ™”ํ•˜๋Š”์ง€๋ฅผ ์•Œ๋ ค์ฃผ๋Š” ๊ธธ์žก์ด ์—ญํ• ์„ ํ•˜๊ธฐ ๋•Œ๋ฌธ์—, ๊ทธ๋ผ๋””์–ธํŠธ ๋ฐฉํ–ฅ์„ ๋”ฐ๋ผ ๋ณ€์ˆ˜๊ฐ’์„ ํŠœ๋‹ํ•˜๋‹ค ๋ณด๋ฉด ํ•จ์ˆ˜์˜ ์ตœ๋Œ€๊ฐ’โ€ข์ตœ์†Œ๊ฐ’์— ๋„๋‹ฌํ•˜์—ฌ ์ตœ์ ํ™” ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋œ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ์™œ ๊ทธ๋ผ๋””์–ธํŠธ ๋ฒกํ„ฐ์˜ ๋ฐฉํ–ฅ์ด ํŠน์ • ์ง€์ ์—์„œ ํ•จ์ˆ˜๊ฐ€ ๊ฐ€์žฅ ๊ฐ€ํŒŒ๋ฅด๊ฒŒ ์ฆ๊ฐ€ํ•˜๋Š” ๋ฐฉํ–ฅ์„ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฒƒ์ผ๊นŒ?? ํŽธ๋ฏธ๋ถ„, ๋„ํ•จ์ˆ˜ ์ •์˜ ๊ทธ๋ฆฌ๊ณ  ๋‚ด์ ์„ ํ™œ์šฉํ•ด ์ฆ๋ช…ํ•  ์ˆ˜ ์žˆ๋‹ค.

๐Ÿชช Proof of Gradient

Example of multivariate function Example of multivariate function

๊ทธ๋ผ๋””์–ธํŠธ ๋ฒกํ„ฐ์˜ ๋ฐฉํ–ฅ์ด ํ•จ์ˆ˜๊ฐ€ ๊ฐ€์žฅ ๊ฐ€ํŒŒ๋ฅด๊ฒŒ ์ฆ๊ฐ€ํ•˜๋Š” ๋ฐฉํ–ฅ๊ณผ ์ผ์น˜ํ•œ๋‹ค๋Š” ๋ช…์ œ๋ฅผ ์ฆ๋ช…ํ•˜๊ธฐ ์œ„ํ•ด ์ตœ๋‹จ ๊ฒฝ๋กœ๋กœ ์‚ฐ ์ •์ƒ์— ์˜ค๋ฅด๋Š” ๊ณผ์ •์„ ๋– ์˜ฌ๋ ค๋ณด๋ ค ํ•œ๋‹ค. ์šฐ๋ฆฌ๋Š” ํ˜„์žฌ ์ด๋ณ€์ˆ˜ ํ•จ์ˆ˜๋กœ ์ •์˜๋˜๋Š” ์‚ฐ ์ค‘ํ„ฑ ์–ด๋”˜๊ฐ€, ์  $(x_1^0, x_2^0)$๋ฅผ ์ง€๋‚˜๊ณ  ์žˆ๋‹ค. ์‚ฐ ์ •์ƒ์„ ์ตœ๋‹จ ๊ฒฝ๋กœ๋กœ ์˜ค๋ฅด๋ ค๋ฉด ์–ด๋–ป๊ฒŒ ํ•ด์•ผํ• ๊นŒ?? ๊ฐ€์žฅ ๊ฒฝ์‚ฌ๊ฐ€ ๊ฐ€ํŒŒ๋ฅธ ๊ธ‰๊ฒฝ์‚ฌ ์ง€๋Œ€๋ฅผ ํ–ฅํ•ด ๋‚˜์•„๊ฐ€๋ฉด ๋  ๊ฒƒ์ด๋‹ค. ํ•˜์ง€๋งŒ ์‚ฐ ์ค‘ํ„ฑ์— ์žˆ๋Š” ์šฐ๋ฆฌ๊ฐ€ ์–ด๋Š ๋ฐฉํ–ฅ์ด ๊ฐ€์žฅ ๊ฐ€ํŒŒ๋ฅธ ๊ธ‰๊ฒฝ์‚ฌ ์ง€๋Œ€์ธ์ง€ ์ง๊ด€์ ์œผ๋กœ ์•Œ ๊ธธ์ด ์—†๋‹ค. ๊ทธ๋ž˜์„œ ๋ฐฉํ–ฅ ๋„ํ•จ์ˆ˜๋ฅผ ๋„์ž…ํ•ด ๊ธ‰๊ฒฝ์‚ฌ ์ง€๋Œ€๋กœ ํ–ฅํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉํ–ฅ์„ ๊ตฌํ•ด ๋ณด๊ธฐ๋กœ ํ–ˆ๋‹ค. ์•„๋ž˜ ์ˆ˜์‹์„ ๋ณด์ž.

\[\lim_{\Delta{x}->0}\frac{f(x+\Delta{x}) - f(x)}{\Delta{x}} = \frac{df}{dx}= f'(x) \\ df = f'(x)dx\]

๋„ˆ๋ฌด๋‚˜๋„ ์ต์ˆ™ํ•œ ํ˜•ํƒœ ์•„๋‹Œ๊ฐ€?? ์šฐ๋ฆฌ๊ฐ€ ์ผ๋ฐ˜์ ์œผ๋กœ ์•Œ๊ณ  ์žˆ๋Š” ์ผ๋ณ€์ˆ˜ ํ•จ์ˆ˜์˜ ๋ฏธ๋ถ„ ์ •์˜ ๊ทธ๋ฆฌ๊ณ  ์ขŒ๋ณ€์˜ $dx$๋ฅผ ์šฐ๋ณ€์œผ๋กœ ๋„˜๊ฒจ ์‚ด์ง ๋ณ€ํ˜•ํ•œ ์‹์ด๋‹ค. ์ด๊ฒƒ์„ ์ด์ œ ๋‹ค๋ณ€์ˆ˜ ํ•จ์ˆ˜์— ์ ์šฉํ•˜๋ฉด ๋ฐ”๋กœ ๋ฐฉํ–ฅ ๋„ํ•จ์ˆ˜๊ฐ€ ๋œ๋‹ค. ๋‹ค์‹œ ์šฐ๋ฆฌ๊ฐ€ ์˜ค๋ฅด๋ ค๋Š” ์‚ฐ(์ด๋ณ€์ˆ˜ ํ•จ์ˆ˜)์œผ๋กœ ๋Œ์•„์™€ ๋ณด์ž.

\[f(x_1 + dx_1, x_2) = f(x_1, x_2) + f'(x_1, x_2)dx_1 \\ f(x_1, x_2 + dx_2) = f(x_1, x_2) + f'(x_1, x_2)dx_2 \\\]

์œ„์—์„œ ์„œ์ˆ ํ•œ ๋„ํ•จ์ˆ˜ ์ •์˜๋ฅผ ํ™œ์šฉํ•ด ์šฐ๋ฆฌ๊ฐ€ ๋‹ค์Œ์— ๋ฐœ๊ฑธ์Œ์„ ์˜ฎ๊ธธ ์œ„์น˜๋ฅผ ์  $A$๋ฅผ $(x_1^0 + dx_1, x_2^0+dx_2)$ ์ด๋ผ๊ณ  ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด ํ‘œํ˜„์„ ํ™œ์šฉํ•ด ๋‹ค๋ณ€์ˆ˜ ํ•จ์ˆ˜์˜ ๋ฏธ๋ถ„์„ ์ •์˜ํ•ด๋ณด์ž. ์šฐ๋ฆฌ๋Š” ์ด๋ฏธ ๋‹ค๋ณ€์ˆ˜ ํ•จ์ˆ˜์˜ ๊ฐœ๋ณ„ ๋ณ€์ˆ˜์— ํŽธ๋ฏธ๋ถ„์„ ์ทจํ•˜๊ณ  ํ–‰๋ฒกํ„ฐ๋กœ ์Œ“์€ ๊ฒฐ๊ณผ๊ฐ€ ๋ฐ”๋กœ ์ „๋ฏธ๋ถ„์ด๋ผ๋Š” ๊ฒƒ์„ ์•Œ๊ณ  ์žˆ๋‹ค.

\[f(x_1 + dx_1, x_2 + dx_2) - f(x_1, x_2) = f'(x_1)dx_1 + f'(x_2)dx_2\]

๋‹ค์‹œ ํŽธ๋ฏธ๋ถ„์˜ ์ •์˜๋ฅผ ํ™œ์šฉํ•ด ์ˆ˜์‹์„ ์ •๋ฆฌํ•˜๋ฉด ๋ฐฉํ–ฅ ๋ฒกํ„ฐ์™€ ํŽธ๋ฏธ๋ถ„ ๊ฒฐ๊ณผ์˜ ๋‚ด์ ์œผ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค.

\[dL = \frac{โˆ‚L}{โˆ‚{x_1}}dx_1 + \frac{โˆ‚L}{โˆ‚{x_2}}dx_2 \\ dL = [dx_1, dx_2]\ โ€ข\ \begin{vmatrix} \frac{โˆ‚L}{โˆ‚x_1} \\ \frac{โˆ‚L}{โˆ‚x_2} \end{vmatrix}\]

์Ÿ์•„์ง€๋Š” ์ˆ˜์‹ ์†์— ์šฐ๋ฆฌ์˜ ๋ณธ๋ž˜ ๋ชฉ์ ์„ ์žŠ์–ด์„œ๋Š” ์•ˆ๋œ๋‹ค. ์šฐ๋ฆฌ๋Š” ์ง€๊ธˆ ๊ฐ€์žฅ ๋น ๋ฅด๊ฒŒ ์‚ฐ ์ •์ƒ์— ๋„๋‹ฌํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์„ ์ฐพ๊ธฐ ์œ„ํ•ด ์ง€๊ธˆ๊นŒ์ง€ ๋‹ฌ๋ ค์™”๋‹ค. ์‚ฐ ์ •์ƒ์— ๊ฐ€์žฅ ๋น ๋ฅด๊ฒŒ ๋„๋‹ฌํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ€์žฅ ๊ฐ€ํŒŒ๋ฅธ ๊ธ‰๊ฒฝ์‚ฌ ์ง€๋Œ€๋งŒ ์ฐพ์•„์„œ ์˜ฌ๋ผ๊ฐ€๋Š” ์ „๋žต์„ ์„ธ์› ์—ˆ๋‹ค. ๋‹ค์‹œ ๋งํ•ด, ๋‹ค๋ณ€์ˆ˜ ํ•จ์ˆ˜ $f(x)$์˜ ๊ทน์†Œ ๋ณ€ํ™”๋Ÿ‰ $dL$์ด ์ตœ๋Œ€๊ฐ€ ๋˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๋ฐœ๊ฑธ์Œ์„ ์˜ฎ๊ธฐ๋ฉด ๋œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ๊ทน์†Œ ๋ณ€ํ™”๋Ÿ‰ $dL$์€ ์–ธ์ œ ์ตœ๋Œ€๊ฐ€ ๋ ๊นŒ??

์ด์ œ ๊นŒ๋จน๊ณ  ์žˆ์—ˆ๋˜ ๋‚ด์ ์˜ ๊ฐœ๋…์„ ๋‹ค์‹œ ํ•œ ๋ฒˆ ์ƒ๊ธฐ์‹œ์ผœ๋ณด์ž. ๋‚ด์ ์€ ๋‹ค์–‘ํ•˜๊ฒŒ ํ•ด์„๋˜์ง€๋งŒ, ๋ณธ๋”” ์„œ๋กœ ๋‹ค๋ฅธ ๋‘ ๋ฒกํ„ฐ์˜ ๋‹ฎ์€ ์ •๋„๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. ๊ทน์†Œ ๋ณ€ํ™”๋Ÿ‰ $dL$์ด ์ตœ๋Œ€๊ฐ€ ๋˜๋ ค๋ฉด ์šฐ๋ณ€์˜ ๋‚ด์  ๊ฒฐ๊ณผ๊ฐ€ ์ตœ๋Œ€๊ฐ€ ๋˜์–ด์•ผ ํ•œ๋‹ค. ๋‚ด์ ์˜ ์ตœ๋Œ€๊ฐ’์€ ์„œ๋กœ ๋‹ค๋ฅธ ๋‘ ๋ฒกํ„ฐ ์‚ฌ์ด์˜ ๋ผ์ธ๊ฐ๋„๊ฐ€ 0หš์ผ ๋•Œ ์ฆ‰, ๋‘ ๋ฒกํ„ฐ๊ฐ€ ๋™์ผํ•œ ๋ฐฉํ–ฅ์„ ๋‚˜ํƒ€๋‚ผ ๋•Œ ์ •์˜๋œ๋‹ค. ๋”ฐ๋ผ์„œ ๋ฐฉํ–ฅ ๋ฒกํ„ฐ๊ฐ€ ๊ทธ๋ผ๋””์–ธํŠธ(ํŽธ๋ฏธ๋ถ„์˜ ํ–‰๋ฒกํ„ฐ) ๋ฐฉํ–ฅ์ผ ๋•Œ ๋‚ด์  ๊ฒฐ๊ณผ(๊ทน์†Œ ๋ณ€ํ™”๋Ÿ‰ $dL$)๊ฐ€ ์ตœ๋Œ€๊ฐ€ ๋œ๋‹ค.

ํ•œํŽธ, ์‹ค์ œ ๊ธฐ๊ณ„ํ•™์Šต์—์„œ๋Š” ์†์‹คํ•จ์ˆ˜์˜ ์ตœ์ ํ™”๋ฅผ ๋ชฉ์  ํ•จ์ˆ˜๋กœ ์‚ฌ์šฉํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ทธ๋ผ๋””์–ธํŠธ(์†์‹คํ•จ์ˆ˜์˜ ์ „๋ฏธ๋ถ„) ๋ฐฉํ–ฅ์— ์Œ์ˆ˜๋ฅผ ์ทจํ•ด์ค€ ๊ฐ’์„ ์‚ฌ์šฉํ•˜๊ฒŒ ๋œ๋‹ค.

Leave a comment