728x90
Back-propagation
MLP Learning
Layer ํ๋๋ฅผ ๋ํ๋ผ ๋ x์ super script๋ฅผ ์ฐ๊ฒ ๋ค๊ณ ๊ฐ์ .
X0 ๋ input vector๊ฐ ๋๋ค. Label์ ํด๋นํ๋ ๋
ธ๋๋ ์ ๋ถ 1
loss function์ Desired ouput๊ณผ real output ์ฌ์ด์ ์ฐจ์ด์ ํด๋นํ๋ค.
์ผ๋จ ์์์ ์ ๋๋คํ node์์ ์์ํด์ ์กฐ๊ธ์ฉ gradient๋ฅผ ๋นผ์ค์ผ๋ก์จ ํ์ต์ ์์ํ๋ค.
Loss Function(Error Criteria)
์ต์ข
output Layer์์ desired output ๊ฐ์ ๋นผ๊ณ ์ ๊ณฑ์ ํด์ C๊ฐ์ ํด๋นํ๋ ๊ฒ ๋งํผ ๋๋ ์ค๋ค.
๊ทธ๋ฌ๋ฉด Error๋ฅผ ์ฐพ์ ์ ์๊ณ Mean square๋ฅผ ํ๊ฒ ๋๋ ๊ณผ์ ์ด ๋๋ค.
์ต๊ทผ์ ๋ค์ด์ Cross entropy function์ด ๋ง์ด ์ฌ์ฉ๋๊ณ ์๋ค,
Softmax activation๊ณผ ์ ์ฐ์ธ๋ค,
Desired output์ด ๋์ค๊ณ Real Output์ log๊ฐ ์ฐ์ด๊ณ ๊ณฑํ๋ ์์ด ๋๋ค.
X(n)์ด D๋ฅผ ์์ธกํ๋๋ฐ ์ผ๋ง๋ ๋์์ด ๋๋๋ฅผ ํํํด์ฃผ๋ ์
Gradient-based learning
Weight์ ๋ํด ๋ฏธ๋ถ์ ํ๊ณ ํ์ฌ weight์์ ๋นผ์ฃผ๋ฉด์ ์งํ์ ํ๊ฒ ๋๋ค.
Back-Progation
ํ์ต์ ํ ๋ gradient๋ฅผ ๊ตฌํ๋๋ฐ ์ด๋ output์ ๋ํด ์ ์๋๋ค๋ผ๋ ๊ฒ.
๊ทธ๊ฒ์ ํตํด ๊ทธ ์ด์ ๊ฒ์ ๊ณ์ฐํ๊ฒ ๋๋๋ฐ ์ด๋ฐ ์๊ณ ๋ฆฌ์ฆ์ Back Propagation์ด๋ผ๊ณ ํ๋ค.
Matrix Notation
y ๊ฐ weighted node์ Summation์ ๋ํ ๊ฐ์ผ๋ก ํํํ๊ฒ ๋๋ค.
์ฌ๊ธฐ์ a๋ฅผ net value๋ผ๊ณ ํ๊ณ ํด๋น ์
๋ ฅ์ ๋ฒกํฐ์ ๋ํด์ ํํํ๊ณ ์ ํ๋ค.
๋ณต์กํ๋ notaion์ด ๊ฐ๋จํ๊ฒ ํํ์ด ๊ฐ๋ฅํ๊ฒ ๋๋ค.
Chain Rule
x์์ y, z๋ก ๊ฐ๋ ๋จผ์ z๋ฅผ y๋ก ๋ฏธ๋ถํ๊ณ y๋ฅผ x ์ ๋ํด ๋ฏธ๋ถํ ๊ฒ์ ๊ณฑํด์ฃผ๋ฉด ๋๋ค.
Loss๋ฅผ Output z์ ๋ํด์ ๋ฏธ๋ถ์ ํด๋ฒ๋ฆฐ ๊ฒ์ผ๋ก๋ถํฐ ์์ํ๋ค.
z๋ฅผ x์ ๋ํด ๋ฏธ๋ถํ ๊ฒ๊ณผ z๋ฅผ y์ ๋ํด ๋ฏธ๋ถํ ๊ฒ๋ง ์์ผ๋ฉด ํ ์ ์๋ค๋ ๊ฒ.
gradient๋ฅผ ๋ฐ๊ฒ ๋๊ณ ์์ ์๊ฒ ํ์ํ gradient๋ฅผ ๊ฐ์ง ์ ์๋ค๋ ๊ฒ์ด key point
Chain Rule
๋ ๊ฐ์ vector์ ํธ๋ฏธ๋ถ์ ํฉ์ ๊ตฌํ๋ฉด ๊ฐ๊ฐ์ ๊ฒฝ์ฐ๋ฅผ ๊ตฌํ ์ ์๋ค.
์ผ๋ฐํ์ํค๋ฉด 2๊ฐ ์ด์์ธ ๊ฒฝ์ฐ์๋ ๊ตฌํ ์ ์๋ค.
๋ธํ์ x๋ฅผ ๋ถ์ด๋ฉด ์ด๋ค ์์ x์ ๋ํด ๋ฏธ๋ถํ ๊ฐ์ด๋ค๋ผ๋ ๋ป.
Z๋ฅผ y์ ๋ํด ๋ฏธ๋ถํ๊ณ Z๋ฅผ x์ ๋ํด ๋ฏธ๋ถํ ๊ฒ
'๐ Self Study > ๐ Deep Learning Basic' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Deep Learning(ImageNet, ProGAN, Vanishing Gradient Problem) (0) | 2021.12.29 |
---|---|
Deep Learning(Gradient and Jacobian, Back Propagation, Training of 1st , 2nd Layer) (0) | 2021.12.29 |
Deep learning (Activation Function, softmax, Hidden Units, Output Units) (0) | 2021.12.23 |
Deep learning (Multi-Layer Perceptron) (0) | 2021.12.23 |
Deep learning (Gradient Descent, Chain Rule, Learning Rate) (0) | 2021.12.23 |