Convolution Network
Deep Learning
Layer๊ฐ ๋ง์ ์ฌ์ธต ์ ๊ฒฝ๋ง์ ์ฌ์ฉํ๊ณ layer ํ๋๋ Weighted Sum์ ํ์ฉํ๋ค. W๋ ๋ฐ์ดํฐ๋ก๋ถํฐ ํ์ต์ ํ๋ ํ๋ผ๋ฏธํฐ์ด๊ณ ๋ง์ง๋ง์๋ Loss function์ ์ ์ํ๋ค. ์ฆ, ๋ชจ๋ Layer์ Weight๋ฅผ ์ต์ ํํ๋ ๊ฒ. ์ด๋ฅผ ๊ฒฐ์ ํ๋ ๊ณผ์ ์ด ํ์ตํ๋ ๊ณผ์ ์ด ๋๋ค. Layer์ ๊ฐ Operation์ ์
๋ ฅ ์ ๋ณด๋ฅผ Weighted Sum์ผ๋ก mergeํ๋๋ฐ ์ด๋ค ๋น์จ๋ก Merge ํ๋๊ฐ๊ฐ ํฌ์ธํธ
Deep Learning Architecture
CNN -> ์์์ฒ๋ฆฌ, ์์ฐ์ด, ์์ฑ์ธ์
: ๋ณ๋ ฌ ์ฒ๋ฆฌ์ ์ํ ์๋ ํฅ์์ ๋ ์ ์ด๋์ด๋ผ ์ ์๋ค.
: ์์ฐ์ด : Machine Translation์ ํจ๊ณผ๊ฐ ๋ ์์๋ค.
RNN -> Time-series Data๋ฅผ ์ฒ๋ฆฌํ๊ธฐ ์ํด์ ๋ง๋ค์ด์ก๋ค. ํ์ง๋ง ์๋๊ฐ ๋๋ฆฌ๋ค.
๋ณ๋ ฌํ๋ฅผ ์ํด ๋ง๋ค์ด์ง ๊ตฌ์กฐ๊ฐ ์๋๋ผ๋ ๊ฒ.
Biological Discoveries
๊ณ ์์ด๋ฅผ ๊ฐ์ ธ๋ค ๋์์ ์๊ทน์ ์ฃผ๊ณ ๋์ ์ด๋ ๋ถ๋ถ์ ๋ฐ์์ด ์๋์ง ๋ถ์์ ํ๋ค. ์๊ฐ ์ ๊ฒฝ์ ๋ฐ์์ด ์์๊ณ ๋ ๊น์ ๊ณณ์ ๊ฐ ์๋ก ๋ ๋ณต์กํ ๋ฐ์์ ํ๋ค๋ ๊ฒ์ด ๋ฐํ์ก๋ค. Visual System์ ๋ํ๋๋ ๋ฐ์์ ์ฑ์ฅํ๋ฉด์ ๋ฐฐ์ด๋ค๋ผ๋ ๊ฒ์ด ๋ฐํ์ก๋ค.
Convolutional Neural Network
์ฒ์ ์ ์๋์์ ๋๋ Training algorithm์ด ์ข์ง๋ ์์๋ค. ํ์ง๋ง, 1998 Gradient Descent ๋ก ๋ฐ์ ์ ํ๊ณ 2012๋
๋ํ์์ ์ฐ์น์ ์ด๋์ด ๋
Convolutional Neural Network(CNN)
3์ฐจ์์ ์ธ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ง๋ค. channel, row, column์ผ๋ก ๋ถ๋ฆฐ๋ค. ๊ณ์ฐ๋์ด ์์ฒญ๋๊ฒ ๋ง๊ธฐ ๋๋ฌธ์ GPU๋ฅผ ์ด์ฉํด์ ๋ณ๋ ฌ์ฒ๋ฆฌ๋ฅผ ํ๋ค. ๋ ๋ง์ ๊ณ์ฐ์ ๋์์ ํ ์๋ก ๋ณ๋ ฌ ์ฒ๋ฆฌ์ ์ด์ ์ ์ทจํ ์ ์๋ค. Sample์ ํ ๊ฐ ์ฃผ๊ณ ๋ณ๋ ฌ์ฒ๋ฆฌ๋ฅผ ํ๋ฉด ํจ๊ณผ๊ฐ ์๊ธฐ ๋๋ฌธ์ ์ฌ๋ฌ ๊ฐ์ Data๋ฅผ ์ฃผ์
ํ๋ค. batch๋ Groupํ ํ ๊ฒ์ ๋งํ๊ณ GPU์ ์ฑ๋ฅ์ ์ต๋๋ก ํ์ฉํ ์ ์๋๋ก ๋์์ค๋ค. mini batch์ ํฌ๊ธฐ๊ฐ 32๋ผ๋ฉด 32D๊ฐ ๋๋ ๊ฒ์ด๋ค. ๊ฐ๋ 5์ฐจ์ ์ ๋ณด๊ฐ ๋ ๋๊ฐ ์๋๋ฐ ์ถ๊ฐ๋๋ ํ๋์ ์ถ์ time์ด ๋๋ค. CNN ๊ฐ๋
์ RNN์ ๊ฐ๋
์ด ํฌํจ๋ ์ ์๋ค. +batch +time. ๊ฐ๋
์ ์ผ๋ก๋ 3์ฐจ์์ด์ง๋ง ํ์ค์ ์ผ๋ก 4์ฐจ์์ ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๋ค.
Convolutional Neural Network(CNN)
์ฒซ Layer๋ ๋๋ถ๋ถ Convolutional Layer๋ฅผ ์ฌ์ฉํ๋ค. ๋ค์ Layer๋ค์ ๋ค์ํ Layer๋ฅผ ๊ต์ฐจ์์ผ ์ฌ์ฉ์ ํ๋ค. ์ค๋ฅธ์ชฝ(๋ท์ชฝ)์ผ๋ก ๊ฐ ์๋ก ๋ ์ธ๊ฐ ์ ๋์ Fully connected Layer๊ฐ ์กด์ฌํ๋ค. 2012๋
๋์ CNN์ด ๋๋ฆฌ ์๋ ค์ง๊ฒ ๋ฌ๋๋ฐ ๊ทธ ๋น์ ๋๋ถ๋ถ์ด Convolution, Pooling, Fully-connected Layer๋ก ๊ตฌ์ฑ์ด ๋์ด์์๋ค. ๊ทธ ์ค ๊ฐ์ฅ ์ค์ํ ๊ฒ์ด Convoluitional Layer์ด๋ค. ์ด์๋ ์ข
๋ฅ๊ฐ ๋ค์๊ณผ ๊ฐ์ด ์ฌ๋ฌ๊ฐ ์กด์ฌํ๋ค. Pooling layer๋ ์ฌ๋ฌ Dimension์ ์กด์ฌํ๋ feature๋ค์ ์ ์ Dimention์ผ๋ก ์ค์ด๋ ์ญํ ์ ํ๋ค. Fully-connected layer๋ Targeting์ ํ๋ ์ญํ ์ ํ๋ค. ์ ํต์ ์ธ ๋ฐฉ๋ฒ์๋ Fully connected Layer๋ฅผ ๋ง์ด ์ฌ์ฉํ๋ค.
Convolution Layer
์์ ์ฒ๋ฆฌ์์ ๋ง์ด ์ฐ์๋ Convolution operator์ ๋์ผํ๋ค.
์
๋ ฅ ์์์ด ์๊ณ Convolution mask (3x3 5x5)๋ฅผ ์์์ผ๋ก๋ถํฐ ํต๊ณผ์ํค๊ณ ํ์นธ์ฉ ์ด๋ํ์ฌ ์ค์บ์ ์๋ฃํ๋ค./
x์ (n-1)์ ๋ฐ Layer์ Feature๋ผ๊ณ ํ ์ ์๋ค.
Convolution Operation
์๊ณ ๋ฆฌ์ฆ์ด ๊ฐ๋ค๊ณ ํ๋๋ผ๋ Mask์ ๊ฐ์ ๋ฐ๋ผ ์์ ํ ๋ค๋ฅธ ๊ฒ์ ๋ง๋ค ์ ์๋ค.
CNN์์ Convolution Mask๊ฐ Weight์ ํด๋นํ๋ค. ์ด Convolutional mask ์์ฒด๊ฐ ํ์ต์ ํด์ผ ํ๋ Weight๊ฐ ๋๋ค.
Convolution Layers
Multi channel ๋ก ๊ตฌ์ฑ๋๊ธฐ๋ ํ๋ค. ํด๋น Neural์ ๊ฒฐ์ ํ๋ channel์ด ํ ๊ฐ๊ฐ ์๋๋ผ ์ฌ๋ฌ๊ฐ์ผ ์๋ ์๋ค.
Dilated Convolution(astrous Convolution)
mask์ dense๊ฐ ์ข ๋๋ค. ์๋ฅผ ๋ค์ด ๋ ์นธ์ ํ๋๋ฅผ ๋ฝ์๋ด๋ ๋ฑ์ผ๋ก ๊ณ์ฐ๋์ด ๊ฐ์ํ๊ฒ ๋๋ค.
Weight์ ๊ฐ์๋ ๊ฐ์ํ๊ฒ ๋๊ณ ํ๋ผ๋ฏธํฐ๋ ์ค์ด๋ค๋ฉฐ Training์ด ๋ ์์ํด์ง๋ค.
3x3 mask๊ฐ 5x5 ์์ญ์ ์ปค๋ฒํ๊ณ ์์ผ๋ฏ๋ก ์ ์ ํ๋ผ๋ฏธํฐ๋ก ๋์ Context๋ฅผ ์ฒ๋ฆฌํ ์ ์๊ฒ ๋๋ค.
Transposed Convolution(fractionally-strided convolution)
๋์ฒด๋ก ํฐ Feature map์ด ์์์ง๋๋ฐ ์คํ๋ ค ์ด๊ฒ์ ์์ feature map์ ํค์ฐ๋ ์ญํ ์ ํ๋ค.
์ผ๋ฐ์ Convolution ํํ๋ฅผ ๋ค์ง์ด ๋์ ํํ๊ฐ ๋๋ค.
Separable Convolution
2์ฐจ์ Convolution์ ์ ์ฉํ๊ณ Channel๊ฐ ์ด๋ฃจ์ด์ง๋ Convolution์ด ์ด๋ฃจ์ด์ง๋ค.
Max-Pooling Layer
์
๋ ฅ feature map์ ์ผ์ ํ ํฌ๊ธฐ๋ก ๋๋๊ณ Maximum ๊ฐ์ผ๋ก ์์ Map์ ๋ง๋ ๋ค.
์ด๋ค ์์ญ์ผ๋ก ๋ค์ด์ค๊ฒ ๋๋ ๋ฐ์ดํฐ๋ ํ๋์ ์ฑ๋ถ์ด๋ค!! ๋ผ๋ ๊ฐ๋
์ผ๋ก ์ฌ์ฉ๋๊ณ ๊ทธ ์ค ๊ฐ์ฅ ์ผ ๊ฐ์ด ๋ํ ์ฑ๋ถ์ ๊ฐ์ง๋ค๋ผ๊ณ ํ๋จํ์ฌ ์ต๋๊ฐ์ ํํ๊ฒ ๋๋ค.