Practical Problem and Solution
Practical Issues
Training Data๋ฅผ ๋ง์ด ํ์๋ก ํ๋ค. ์ด์ ๋ํ ํด๊ฒฐ์ฑ
์ ๋ฐ์ดํฐ๋ฅผ ๋ง์ด ๋ชจ์ผ๋ ๊ฒ์ด๊ณ ์ต๊ทผ ๋จธ์ ๋ฌ๋์ ํ๋ ์ฌ๋๋ค์ด ๋ฐ์ดํฐ๋ฅผ ๋ง์ด ๋ชจ์๋์๋ค๋ ๊ฒ.
Regularization techinque / data augmentation : ์ ์ ๋ฐ์ดํฐ๋ก๋ถํฐ ๋ง์ ๋ฐ์ดํฐ๋ฅผ ํฉ์ฑํด๋ด๋ ๊ฒ
Unsupervised / semi-supervised /
reinforcement learning : ์ ๋ต์ด ์๋ ํผ๋๋ฐฑ๋ง์ผ๋ก ์งํ๋๋ค๋ ์
Computation ์ ๋ง์ด ํ์๋ก ํ๋ค.
Regularization
Boundary๊ฐ ๋ณต์กํ๋ฉด training data์ ๋ํด์๋ ์ํ์ง๋ง ์ง๊ธ๊น์ง ๋ณด์ง ๋ชปํ๋ ๋ฐ์ดํฐ์ ๋ํด์ ์ฒ๋ฆฌํ๊ธฐ ํ๋ค๋ค๋ ๊ฒ์ด์๋ค. ๋ฐฉ์ ์์ ์ ์๋ฐ ๋ฏธ์ง์๊ฐ ๋ง๋ค๋ผ๊ณ ํด์์ด ๊ฐ๋ฅํ๋ค. ๊ทธ๋ฐ ๋ฌธ์ ๋ฅผ ill-posed problem ์ด๋ผ๊ณ ํ๋ค. E(W) ์ ๊ฒฝ์ฐ Weight์ Constrain์ ์ค์ ๋ง์ ํ์ต์ ํ๋๋ก ํด์ผ ํ๋ค. norm of Weight ์ฆ, weight์ ๋ํ ์ ์ฝ์ ์ฃผ๋ ๊ฒ.
Transfer Learning
์ ์ด ํ์ต์ด๋ผ๊ณ ํํํ๋ค. ํ ๋ฌธ์ ๋ฅผ ํ์ตํ๋๋ฐ ์์ด์์ ์ ๋ณด๋ฅผ ๋ค๋ฅธ ์ชฝ์ผ๋ก ์ ์ฉ์ํค๋ ๊ฒ์ ๋งํ๋ค. ๋ฐ๋์ ๊ฒฝ์ฐ ๋ฐฐ์ธ ์ ์๋ ํ
ํฌ๋์ด ์ฅ๊ธฐ๋ฅผ ๋๋๋ฐ ๋์์ด ๋ ์ ์๋๊ฐ? ์ ๋ํ ๋น์ ๋ก ๋ง์ํ์
จ๋ค. ์๋์ฐจ๋ฅผ ์ธ์ํ๋ ๋ฐ์ดํฐ๊ฐ ๋ถ์กฑํ ๊ฒฝ์ฐ Neural Network, ๋์ฉ๋ ๋ฐ์ดํฐ๋ฅผ ์ญ ํ์ตํ ๋ค์์ ์ค๊ฐ๋ถ์ ๊ฒฝ์ฐ๋ฅผ ์๋ก์ด ๋ฌธ์ ์ ์ ์ฉ์ ์ํค๋ฉด ์ฑ๋ฅ์ด ์๋นํ ์ข์์ง๋ค. ๋์ฉ๋ ๋ฐ์ดํฐ๋ก ํ ์ ์๋ ๋ฌธ์ ๋ฅผ ์ ํ์ต์ํจํ Classification Layout์ ๋ด๊ฐ ํ ์ ์๋ ๋ฌธ์ ๋ก ๋ฐ๊พผ ํ ์ถ๊ฐ ํ์ต์ ์งํํ๋ค๋ฉด
Internal Covariate Shift
๋ฐ์์ ์ด๋ค ๋ถํฌ๋ฅผ ๊ฐ๊ณ ์๋ค๋ผ๋ ๊ฐ์ ์ผ๋ก ํ์ต์ ํ๊ฒ ๋๋ค. ๊ทธ๋ฐ๋ฐ ํ์ต์ด ๋๋ ๋์ ๋ฐ์ Layer๋ค์ด ํ์ต์ ํ๊ฒ ๋๊ณ Conversion ๋ ์ํ์์์ ๋ถํฌ๊ฐ ์๋ก ๋ง์ง ์์์ ์์ชฝ layer์ ํ์ตํจ๊ณผ๊ฐ ๋จ์ด์ง๋ ํ์์ Intercal Convariate Shift ๋ผ๊ณ ํ๋ค.
Batch Normalization
x์ ํ๊ท ์ ๋นผ๊ณ ํ์คํธ์ฐจ๋ก ๋๋๊ฒ ๋๋ ์ ๊ทํ ๊ณผ์ ์ Batch Normalization์ด๋ผ๊ณ ํ๋ค. ๋ฐ Layer์ Batch๋ฅผ ํ์คํ ์์ผ์ฃผ๋ ๊ณผ์ ์ด ๋๋ค.
Batch Normalization
์๋ Internal Covariate Shift๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์ ๋์จ ๊ฐ๋
์ด์ง๋ง ๋ค๋ฅธ ๊ฒ์ ํจ๊ณผ๊ฐ ์๋ค๋ ๊ฒ์ด ๋ฐํ์ก๋ค.
ReLU Activation Funciton
์ข์์
1. ๋น ๋ฅด๋ค. Exponension์ด ๋ค์ด๊ฐ์ง ์๊ณ maximun ์ฐ์ฐ ํ๋์ด๋ค.
2. ์ฌ๋ฌ ์ ๋ณด๊ฐ ํ๋์ ๋
ธ๋์ merge๋์ด ํน์ง์ด ์์ด๊ฒ ๋๋ค. (Hidden Layer)
Non Zero์ ๊ฐ์ ๊ฐ๋ ๋
ธ๋๊ฐ ์ ๊ฒ ์ ์งํ ์ ์๋ค.
3. ๋ํจ์๊ฐ 0์ ๊ฐ๊น์ด ๊ฐ์ ๊ฐ์ง์ง ์๊ธฐ ๋๋ฌธ์ ์ํฅ์ด ์ ๊ฒ ๋ฐ์ํ๋ค.
์์ข์ ์
1. Negativeํ ์ ์ ๋ํด์๋ ํ์ต์ด ์ ํ ์ด๋ฃจ์ด์ง์ง ์๋๋ค.
2. Positive ๋ฐฉํฅ์ ๋ํด์ Boundary๊ฐ ์๋ค.
์ด๋ ๊ฒ ๋๋ฉด Deep Network์ RNN์์ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ค. ์ํ์ ์ผ๋ก Overflow๊ฐ ๋ฐ์ํ ์ ์๋ค.
Sparse Coding
Dimenstion ์์ฒด๋ ํด ์ ์์ง๋ง ์์ Neural ๋ง์ ์ก์๋ด์ ๋
ธ์ด์ง๋ฅผ ์์ ์ค ์ ์๋ค.