Updated:

Chain Rule 이라고 λΆˆλ¦¬κΈ°λ„ ν•˜λŠ” ν•©μ„±ν•¨μˆ˜ 미뢄법은 λ―Έμ λΆ„ν•™μ—μ„œ νŠΉνžˆλ‚˜ μ€‘μš”ν•œ κ°œλ… 쀑 ν•˜λ‚˜λ‹€. κ·Όλž˜μ—λŠ” 신경망을 ν™œμš©ν•œ λ”₯λŸ¬λ‹μ΄ μ£Όλͺ©λ°›μœΌλ©΄μ„œ κ·Έ μ€‘μš”μ„±μ΄ λ”μš± λΆ€κ°λ˜κ³  μžˆλ‹€. 신경망 λͺ¨λΈμ€ μ‰½κ²Œ μƒκ°ν•˜λ©΄ 정말 λ§Žμ€ 1μ°¨ν•¨μˆ˜μ™€ μ—¬λŸ¬ ν™œμ„±ν•¨μˆ˜λ₯Ό ν•©μ„±ν•œ 것과 κ°™κΈ° λ•Œλ¬Έμ΄λ‹€. λ”°λΌμ„œ 였차 역전을 톡해 κ°€μ€‘μΉ˜λ₯Ό μ΅œμ ν™” ν•˜λŠ” 과정을 μ •ν™•νžˆ μ΄ν•΄ν•˜λ €λ©΄ ν•©μ„±ν•¨μˆ˜ 미뢄법에 λŒ€ν•œ μ΄ν•΄λŠ” ν•„μˆ˜μ μ΄λ‹€.

πŸ’‘Β Concept

ν•©μ„±ν•¨μˆ˜ 미뢄을 μ΄ν•΄ν•˜κΈ° 전에 λ¨Όμ € λ„ν•¨μˆ˜ ν‘œκΈ°λ²•μ— λŒ€ν•΄μ„œ μ΅μˆ™ν•΄μ§ˆ ν•„μš”κ°€ μžˆλ‹€. λ„ν•¨μˆ˜ ν‘œκΈ°λ²•μ€ 크게 뉴턴 ν‘œκΈ°λ²•κ³Ό λΌμ΄ν”„λ‹ˆμΈ  ν‘œκΈ°λ²•μœΌλ‘œ λ‚˜λ‰œλ‹€. μ•„λž˜ ν‘œκΈ°λœ μˆ˜μ‹μ„ 보자. (1)번 μˆ˜μ‹μ΄ 뉴턴 ν‘œκΈ°λ²•, (2)번이 λΌμ΄ν”„λ‹ˆμΈ μ˜ ν‘œκΈ°λ²•μ΄λ‹€.

\[y'= 2x\ \ \ \ (1) \\ f'(x) = 2x\ \ \ (2)\]

이제 μ•„λž˜μ™€ 같은 ν•©μ„±ν•¨μˆ˜κ°€ μžˆλ‹€κ³  κ°€μ •ν•΄λ³΄μž. λ„ν•¨μˆ˜μ˜ μ •μ˜μ— λ”°λΌμ„œ ν•΄λ‹Ή ν•¨μˆ˜μ— λŒ€ν•œ λ„ν•¨μˆ˜λŠ” λ‹€μŒκ³Ό 같이 ν‘œν˜„ν•  수 μžˆμ„ 것이닀.

\[y = g(f(x))\ \ \ (3) \\ y' = {g(f(x))}' = \frac{dy}{dx}\ \ \ (4)\]

μœ„μ— μž‘μ„±ν•œ μˆ˜μ‹λ“€μ€ μž μ‹œ 잊고 이제 $f’(x)$ λ₯Ό λ¨Όμ € μƒκ°ν•΄λ³΄μž. $f(x)$에 λŒ€ν•œ λ„ν•¨μˆ˜ $f’(x)$λŠ” λ‹€μŒκ³Ό 같이 λ‚˜νƒ€λ‚Ό 수 μžˆλ‹€.

\[u = f(x) \\ u' = f'(x) = \frac{du}{dx} \\\]

κ·Έλ ‡λ‹€λ©΄ ν•¨μˆ˜ $g$에 λŒ€ν•œ λ„ν•¨μˆ˜λŠ” μ–΄λ–»κ²Œ λ‚˜νƒ€λ‚Ό 수 μžˆμ„κΉŒ?? 닡은 λ°”λ‘œ μΉ˜ν™˜μ„ μ΄μš©ν•˜λŠ” 것이닀. μœ„μ—μ„œ μš°λ¦¬λŠ” $f(x)$κ°€ $u$와 κ°™λ‹€κ³  μ •μ˜ν–ˆλ‹€. 이것을 μ΄μš©ν•΄ λ„ν•¨μˆ˜ $g’$λŠ” λ‹€μŒκ³Ό 같이 λ‚˜νƒ€λ‚Ό 수 μžˆκ² λ‹€.

\[y' = g'(u) = \frac{dy}{du} \\\]

λˆˆμΉ˜κ°€ λΉ λ₯΄λ‹€λ©΄ 벌써 μ™œ ν•©μ„±ν•¨μˆ˜ 미뢄법을 Chain Rule이라고 λΆ€λ₯΄λŠ”지 κΉ¨λ‹«κ²Œ λ˜μ—ˆμ„ 것이닀. (4)번 μˆ˜μ‹μ˜ μš°λ³€μ€ 사싀 λΆ„μžμ™€ λΆ„λͺ¨μ— μœ„μΉ˜ν•œ $du$κ°€ μ•½λΆ„λœ 꼴이라고 λ³Ό 수 μžˆλ‹€. 이것을 뉴턴 ν‘œκΈ°λ²•μœΌλ‘œ λ‚˜νƒ€λ‚΄λ©΄ μ•„λž˜μ™€ κ°™λ‹€.

\[y' = \frac{dy}{du}β€’\frac{du}{dx}\]

뉴턴 ν‘œκΈ°λ²•μ€ 직관적이지 μ•ŠκΈ° λ•Œλ¬Έμ— λΌμ΄ν”„λ‹ˆμΈ  ν‘œκΈ°λ²•μœΌλ‘œ λ‹€μ‹œ μ •λ¦¬ν•˜λ©΄ λ‹€μŒκ³Ό κ°™λ‹€.

\[y' = g'(f(x))β€’f'(x)\]

μ•„λ§ˆ 고등학ꡐ λ•ŒλŠ” ν•©μ„±ν•¨μˆ˜ λ―ΈλΆ„ 곡식을 κ²‰λ―ΈλΆ„β€’μ†λ―ΈλΆ„μ΄λΌλŠ” λͺ…μΉ­μœΌλ‘œ 처음 μ ‘ν–ˆμ„ 것이닀. μ•ˆμ— 감싸져 μžˆλŠ” ν•¨μˆ˜λ₯Ό λ―ΈλΆ„ν•΄μ„œ λ°–μœΌλ‘œ λΉΌλ‚Έλ‹€ ν•΄μ„œ 속미뢄이라 λΆ€λ₯΄κ³ , λ‹€μ‹œ 속은 냅두고 λ°–μ˜ λ‘˜λŸ¬μ Έ μžˆλŠ” ν•¨μˆ˜λ§Œ λ―ΈλΆ„ν•œλ‹€ν•΄μ„œ 겉미뢄이라 μΉ­ν•˜λŠ”λ°, μ΄λ ‡κ²Œ λ‹¨μˆœν•˜κ²Œ μ™Έμš°κΈ°λ³΄λ‹€λŠ” 곡식이 λ„μΆœλ˜λŠ” 흐름을 μ΄ν•΄ν•˜λŠ” 것이 훨씬 였래 기얡에 λ‚¨λŠ”λ‹€. λΆ€λ„λŸ½μ§€λ§Œ ν•„μžκ°€ λ°”λ‘œ κ·ΈλŸ¬ν–ˆλ‹€. λŒ€ν•™κ΅μ— μž…ν•™ν•˜κ³  μˆ˜λ„ 없이 ν•©μ„±ν•¨μˆ˜ 미뢄을 ν•΄μ•Ό ν–ˆμ§€λ§Œ μ‚¬μš©ν•  λ•Œλ§ˆλ‹€ κΉŒλ¨Ήμ–΄μ„œ 인터넷을 μ°Ύμ•„λ³΄κ±°λ‚˜ κ΅κ³Όμ„œλ₯Ό 뒀적뒀적 ν–ˆλ˜ 기얡이 μžˆλ‹€. 이글을 μ½λŠ” λ…μžλ“€μ€ λ‚˜μ™€ 같은 μ‹€μˆ˜λ₯Ό λ°˜λ³΅ν•˜μ§€ μ•ŠκΈ°λ₯Ό 바라며 ν¬μŠ€νŒ…μ„ λ§ˆμΉœλ‹€.

Leave a comment