π Newton-Raphson Method for Optimization
π€Β Zero-Find Ver
λΉμ ν λ°©μ μμ κ·Όμ¬ν΄λ₯Ό μ°Ύκ±°λ μ΅μ ν λ¬Έμ λ₯Ό ν΄κ²°νλ λ°©μμΌλ‘, κ°μ κ³Όμ μ λ°λ³΅ν΄ μ΅μ κ°μ μλ ΄νλ€λ μ μμ κ²½μ¬νκ°λ²μ΄λ κ·Όλ³Έμ΄ κ°λ€. λ°λ©΄, κ²½μ¬νκ°μ λΉν΄ λΉ λ₯Έ μλ ΄ μλλ₯Ό μλνκ³ νμ΄ λ°©μμ΄ λ§€μ° κ°λ¨νλ€λ μ₯μ μ΄ μλ€. νμ§λ§ μ¬λ¬ μ μ½ μ‘°κ±΄κ³Ό λλΆμ΄ ν΄λΉ μκ³ λ¦¬μ¦μ΄ μ μλνλ μν©μ΄ λΉνμ€μ μΈ λΆλΆμ΄ λ§μ κ²½μ¬νκ°μ λΉν΄ μμ£Ό μ¬μ©λμ§λ μκ³ μλ€. λ΄ν΄-λ©μ¨ λ°©μμ κ·Όμ¬ν΄λ₯Ό μ°Ύκ±°λ, μ΅μ ν λ¬Έμ λ₯Ό νΈλ λ κ°μ§ λ²μ Όμ΄ μλλ° λ¨Όμ ν΄λ₯Ό μ°Ύλ λ²μ λΆν° μ΄ν΄λ³΄μ. μκ³ λ¦¬μ¦μ μμμ λ€μκ³Ό κ°λ€.γ
\[x_{n+1}:= x_n - \frac{f(x_n)}{f'(x_n)}\]λ°λ³΅λ²μ μ¬μ©νκΈ° λλ¬Έμ μμμ μκΉμκ° μλΉν κ²½μ¬νκ°λ²κ³Ό λΉμ·νλ€. μ μ΄λ° μμμ΄ λ±μ₯νκ² λμμκΉ?? μΌλ¨ λ΄ν΄-λ©μ¨ λ°©μμ νμ΄ κ³Όμ μ μ΄ν΄λ³΄μ. λ¨Όμ μ΄κΈ°κ°μ μ€μ νλ€. κ·Έ λ€μ ν΄λΉ μ μ μ§λλ μ μ μ λ°©μ μμ μΈμ΄λ€. μ΄μ μ μ μ λ°©μ μμ $x$μ νΈμ ꡬνκ³ μ΄κ²μ λ€μ μ΄κΈ°κ°μΌλ‘ μ¬μ©νλ€. μ΄μ $f(x_n) \approx 0$μ΄ λ λκΉμ§ μ κ³Όμ μ μ§μμ μΌλ‘ λ°λ³΅νλ©΄ λλ€. μλ κ·Έλνμ ν¨κ» λ€μ μ΄ν΄λ³΄μ.
μ΄κΈ°κ°μ $x_0=3$μ΄λ€. μμμ $(x_0, f(x_0))$μ μ§λλ μ μ μ λ°©μ μμ μΈμ°κ³ ν΄λΉ λ°©μ μμ $x$μ νΈμ ꡬνλ μμμ μμ±νλ©΄ μλμ κ°λ€.
\[f'(x_0)(x-x_n) + f(x_0) = 0\]μ΄μ μ΄κ²μ μμκ² μ μ 리ν΄μ λ€μ μ΄κΈ°κ° $x_1$μ ꡬν΄λ³΄μ.
\[x = x_0 - \frac{f(x_0)}{f'(x_0)}\]μ΄λ² ν¬μ€νΈ 맨 μ²μμ λ΄€λ λ΄ν΄-λ©μ¨ λ°©λ²μ μμκ³Ό λκ°λ€λ κ²μ μ μ μλ€. λ€μ λ§ν΄ λ΄ν΄-λ©μ¨μ Zero-Find λ²μ μ μ μ μ λ°©μ μμ $x$μ νΈμ νμ©ν΄ λͺ©μ ν¨μμ ν΄λ₯Ό μ°Ύμκ°λ λ°©μμΈ κ²μ΄λ€.
μ§κΈκΉμ§ κ·Όμ¬ν΄λ₯Ό μ°Ύμμ£Όλ λ΄ν΄-λ©μ¨ λ©μλλ₯Ό μ΄ν΄λ³΄μλ€. νμ§λ§ λ¨Έμ λ¬λμ²λΌ νμ€μ μ΅μ ν λ¬Έμ λ₯Ό νμ΄μΌ νλ μ°λ¦¬ μ μ₯μμλ λ¨μ λͺ©μ ν¨μμ κ·Όμ μ°Ύλ κ²λ§μΌλ‘λ μ£Όμ΄μ§ λ¬Έμ λ₯Ό ν΄κ²°ν μ μλ€. λ¨Έμ λ¬λμ μ΅μ ν λμμΈ λΉμ© ν¨μλ κ±°μ λͺ¨λ κ²½μ°μ κ·Όμ΄ μκΈ°(λ² μ΄μ§μ μ€μ°¨κΉμ§ κ³ λ €νλ©΄ μ¬μ€μ λΆκ°λ₯) λλ¬Έμ μΌλ¨ μκ³ λ¦¬μ¦μ κ°μ μμ²΄κ° μ±λ¦½νμ§ μλλ€. μ΄λ¬ν νκ³μ μ 극볡νκ³ μ μ΅μ ν λ²μ μ λ΄ν΄-λ©μ¨ λ©μλκ° λ±μ₯νκ² λλ€.
πΒ Optimization Ver
\[x_{n+1}:= x_n - \frac{f'(x_n)}{f''(x_n)}\]
μ΅μ ν λ²μ μ λ΄ν΄ λ©μ¨ λ©μλλ μ΄κ³λν¨μλ₯Ό μ¬μ©νλ€. μν¨μ(λΉμ©ν¨μ)κ° κ·Όμ΄ μμμ§λΌλ, ν¨μμ κ·Ήμ μ΄ μ‘΄μ¬νλν λν¨μμ κ·Όμ νμ μ‘΄μ¬νλ€λ κ°μ μμ μΆλ°νλ€. κ·Όμ μ°Ύλ νμλ λμΌνκ² νλ, μ΄λ²μλ μν¨μμ κ·Όμ΄ μλλΌ λν¨μμ κ·Όμ μ°Ύλλ€. λν¨μμ κ·Όμ¬ν΄λ₯Ό μ°ΎμΌλ©΄, ν΄λΉ μμΉλ κ΅μ/μ μ μ΅μ κ°μ κ·Όμ ν μμΉμΌ κ²μ΄λΌκ³ κΈ°λν΄λ³Ό μ μλ€.
νμ§λ§ μ΅μ ν λ²μ μ λ΄ν΄ λ©μ¨ λ©μλ μμ μ¬μ ν λ§μ λ¨μ μ κ°κ³ μλ€. μΌλ¨ λ¨Όμ κ³μ°λμ΄ μ§λμΉκ² λ§μμ§λ€. μμλ₯Ό λͺ¨λ μ€μΉΌλΌ ννλ‘ λ€μ΄μ κ°λ¨ν΄ 보μ΄μ§λ§, λ€λ³μν¨μμ μ μ©νλ©΄ κ³Όμ μ΄ λ§€μ° λ§€μ° λ³΅μ‘ν΄μ§λ€. λͺ¨λ iteration
λ§λ€ μμ½λΉμ, ν€μμ νλ ¬μ ꡬν΄μ€μΌ νλ€. λν¨μλ§ μ΄μ©νλ κ²½μ¬ νκ°μ λΉν΄ μ°μ° λΆλ΄μ΄ μλΉν μ»€μ§ μ λ°μ μλ κ²μ΄λ€. κ·Έλ¦¬κ³ κ²°μ μ μΌλ‘ ν€μμ νλ ¬μ΄ invertible
ν΄μΌνλ€. μ΄κ² κ°μΈμ μΌλ‘ λ΄ν΄-λ©μ¨
λ°©μμ κ°μ₯ ν° λ¨μ μ΄λΌκ³ μκ°νλ€. ν€μμ νλ ¬μ μνλ ¬μ΄ μ‘΄μ¬νλ €λ©΄ λ°λμ μν¨μλ Convex Function
μ΄μ΄μΌ νκΈ° λλ¬Έμ΄λ€. λ°λΌμ μλΉν λΉνμ€μ μΈ νμ΄ λ°©μμ΄λΌκ³ λ³Ό μ μλ€.
ννΈ, μ λͺ¨λ μ μ½ μ‘°κ±΄μ λ§μ‘±νλ€λ©΄ μ΅μ ν λ²μ μ λ΄ν΄-λ©μ¨ λ°©μμ κ²½μ¬νκ°μ λΉν΄ μλΉν λΉ λ₯Έ μλ ΄ μλλ₯Ό κ°λλ° κ·Έ μ΄μ λ₯Ό κ°λ¨ν μ΄ν΄λ³΄μ. κ²°κ³ΌλΆν° μ€λͺ
νλ©΄ λ΄ν΄-λ©μ¨ λ°©μμ΄ μ¬μ€μ Least Square Method(μ΅μ μμΉλ²)
μ λμΉλΌμ κ·Έλ λ€. λͺ©μ ν¨μ $f(x)$λ₯Ό MSE
λ‘ λκ³ μ ν νκ· λ¬Έμ λ₯Ό νΈλ μν©μ κ°μ ν΄λ³΄μ.
λͺ©μ ν¨μλ₯Ό μ μνκΈ° λλ¬Έμ μ°λ¦¬λ μ΄μ λͺ©μ ν¨μμ λν¨μμ μ΄κ³λν¨μλ₯Ό ꡬν μ μλ€.
\[f'(x) = -2A^T(Z-Ax)\\ f''(x) = 2A^tA\]λν¨μμ μ΄κ³λ ν¨μλ₯Ό λ΄ν΄βλ©μ¨ μμμ λμ νλ©΄ λ€μκ³Ό κ°λ€.
\[x_{n+1} := x_n + \frac{A^T(Z-Ax)} {A^TA} = x_n + (A^TA)^{-1}A^T(Z-Ax)\]λΆλͺ¨λ ν€μμ νλ ¬κ³Ό λμΉλ€. νλ ¬λ‘ μ΄λ€ μλ₯Ό λλ μλ μκΈ° λλ¬Έμ λλμ νν λμ μνλ ¬λ‘ νκΈ°νλ€. κ·Έλ¦¬κ³ μμμ΄ μλΉν λλ½κΈ° λλ¬Έμ μ 리λ₯Ό μν΄ μ κ°λ₯Ό ν΄λ³΄λ € νλ€. μ κ° κ²°κ³Όλ λ€μκ³Ό κ°λ€.
\[x_{n+1} := x_n + (A^TA)^{-1}A^TZ - (A^TA)^{-1}A^TAx_n = (A^TA)^{-1}A^TZ\]ν€μμ νλ ¬μ΄ invertible
ν΄μΌνλ€λΌλ μ μ½ μ‘°κ±΄μ΄ μ¬κΈ°μ λ±μ₯νλ€. λ§μ½ ν€μμ νλ ¬μ΄ invertible
μ΄λΌλ©΄, λ€ λ λΌκ°κ³ μ°λ³μ νλ§ λ¨κ² λλ€. μ°λ³μ νμ μμΈν μ΄ν΄λ³΄λ©΄, Least Square Method(μ΅μ μμΉλ²)
μ μμκ³Ό λμΌνλ€λ κ²μ μ μ μλ€. κ²½μ¬νκ°κ³Όλ λ€λ₯΄κ² $x_n$κ³Ό κ΄λ ¨λ νμ΄ μμμ μ ν λ¨μμμ§ μκΈ° λλ¬Έμ, μ΅μ μμΉλ² μμμ ν λ² νμ΄λ΄λ κ²λ§μΌλ‘ κ·Ήμ μ λλ¬νμ¬ μλ ΄μλκ° ν¨μ¬ λΉ λ₯΄κ² λλ κ²μ΄λ€.
Newton-Raphson for Optimization
λ λ°©μμ΄ μ΅μ ν λ¬Έμ λ₯Ό νμ΄λκ°λ κ³Όμ μ λΉκ΅νκΈ° μν΄ μκ°νλ₯Ό μλν΄λ΄€λ€. νμμ μκ°ν μ€λ ₯μ΄ λ§€μ° μ’μ§ λͺ»ν΄ κ·Έ μ°¨μ΄κ° μ§κ΄μ μΌλ‘ μ μ보μΈλ€β¦ λΉ¨κ° μ§μ μ λ΄ν΄-λ©μ¨ λ°©μμ΄κ³ νλ μ§μ μ κ²½μ¬ νκ° λ°©λ²μ΄λ€. μ μλ μμμ μ΄ν΄λ³Έ κ²μ²λΌ νλ²μ κ·Ήμμ μΌλ‘ μ΄λνλ κ²μ λ³Ό μ μλ€. ννΈ νμλ μλ§μ Iteration
μ κ±°μ³ κ·Ήμμ μ λλ¬νλ€. νμμ μκ°ν μλ£κ° μλΉν μ’μ§ λͺ»νλ€κ³ μκ°ν΄ νλ¨μ νννμλμ μλ£λ ν¨κ» 첨λΆνμΌλ μ°Έκ³ νμ. ν¨μ¬ μ§κ΄μ μΌλ‘ μ 보μΈλ€.
Leave a comment