๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿš“ Self Study/๐ŸŸ  Deep Learning Basic

Deep learning (Neural Network, Perceptron Neuron)

by UKHYUN22 2021. 12. 23.
728x90
Neural Network
์ƒ๋ฌผํ•™์ ์ธ ๋‡Œ์„ธํฌ๋ฅผ ๋ชจ๋ฐฉํ•ด์„œ ๋งŒ๋“  Computation Model. 
์•ž ์ชฝ์—์„œ ์‹ ํ˜ธ๋ฅผ ๋ฐ›์•„์„œ Mergeํ•˜๊ณ  ์ผ์ • ์ˆ˜์น˜ ์ด์ƒ์ด๋ฉด ๋‹ค์Œ์œผ๋กœ ๋„˜๊ธฐ๋Š” ์—ญํ• ๋กœ ์•Œ๋ ค์ ธ ์žˆ๋‹ค.
์‚ฌ๋žŒ์˜ ๋‡Œ๋Š” ๋ณต์žกํ•œ ์ผ์„ ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ ๋‰ด๋Ÿฐ ํ•˜๋‚˜์˜ ๋‹จ์œ„๋Š” ๊ต‰์žฅํžˆ ๋‹จ์ˆœํ•˜๋‹ค๋Š” ๊ฒƒ.
์ด๋Ÿฐ ๊ฐœ๋…์œผ๋กœ ์ปดํ“จํŒ…์„ ํ•˜๊ธฐ ์œ„ํ•œ ๋ชจ๋ธ๋ง์„ ์‹œ์ž‘ํ–ˆ๋‹ค.
Connection Weight์„ ๊ณฑํ•ด์„œ ๊ฐ ๋ฐ์ดํ„ฐ๋ฅผ ๋”ํ•ด์„œ Mergeํ•ด์ฃผ๊ณ  Activation Function ์„ ํ†ตํ•ด์„œ ํ•จ์ˆ˜๊ฐ€ ๋งŒ๋“ค์–ด์ง„๋‹ค.
๋ชจ๋“  ๊ฐ’์ด ์‹œ๊ทธ๋งˆ๋กœ ์ธํ•ด ๋”ํ•ด์ง€๊ณ  (์„ธํƒ€)๋ผ๋Š” ๊ฐ’์„ ๋”ํ•˜๊ฒŒ ๋œ๋‹ค.
์ด (์„ธํƒ€)์˜ ๊ฒฝ์šฐ ์ง์„ ์˜ ๋ฐฉ์ •์‹ y = ax + b์—์„œ b๊ฐ€ ์žˆ์–ด์•ผ ๋ชจ๋“  ์ง์„ ์ด ํ‘œํ˜„๋˜๋“ฏ Bias๋ฅผ (์„ธํƒ€)๋กœ ๋”ํ•˜๊ฒŒ ๋˜๋Š” ๊ฒƒ์ด๋‹ค.
๋‰ด๋Ÿฐ ํ•˜๋‚˜๊ฐ€ ํ•˜๋Š” ๊ฒƒ์„ weighted sum์˜ ํ˜•ํƒœ๋กœ Mergeํ•˜๋Š” ๊ฒƒ,
์ž…๋ ฅ ์ •๋ณด๋ฅผ Mergeํ•ด์„œ ์ข€ ๋” High Level ๋กœ ๋ฐ”๊พธ๋Š” ์—ญํ• ์„ ํ•œ๋‹ค.
Nearal Network์—์„œ ๊ฐ€์žฅ ์ค‘์š”ํ•œ ๊ฒƒ์€ weight๋ฅผ ์–ผ๋งˆ๋กœ ํ•ด์•ผํ•˜๋Š” ์ง€๊ฐ€ ์ค‘์š”ํ•˜๋‹ค.
์ด๋ ‡๊ฒŒ ์ƒ๊ธด ๋‰ด๋Ÿฐ์ด ์—ฌ๋Ÿฌ๊ฐœ๋ฅผ ๊ตฌ์„ฑํ•˜๋ฉด์„œ ์—ฌ๋Ÿฌ๊ฐœ์˜ Layer๊ฐ€ ๊ตฌ์„ฑ๋˜๊ณ  ์ด๋ ‡๊ฒŒ ํ•˜๋‚˜์˜ Network๊ฐ€ ๊ตฌ์„ฑ๋œ๋‹ค.
Weight๋ผ๋Š” ๊ฒƒ์€ ๋…ธ๋“œ์™€ ๋…ธ๋“œ๋ฅผ ์—ฐ๊ฒฐํ•˜๋Š” ์ง‘ํ•ฉ์ฒด๊ฐ€ ๋œ๋‹ค. Neural Network๊ฐ€ ์–ด๋–ค ์ผ์„ ๋ฐฐ์› ๋‹ค๋ผ๋Š” ๊ฒƒ์€ ๊ทธ Task๋ฅผ ์ˆ˜ํ–‰ํ•˜๋ฉด์„œ
๊ฐ€์žฅ ์ตœ์ ์˜ weight๋ฅผ ์ฐพ์•˜๋‹ค๋ผ๋Š” ๊ฒƒ์ด๋‹ค. ๋ฌด์—‡์ธ๊ฐ€๋ฅผ ๋ฐฐ์› ๋‹ค๋ผ๊ณ  ํ•  ๋•Œ Knowledge๊ฐ€ weight์— ์ €์žฅ๋œ๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค.
Connection Weight์€ Training data์— ์˜ํ•ด์„œ ์ž๋™์œผ๋กœ ์ตœ์ ํ™” ํ•  ์ˆ˜ ์žˆ๋‹ค.
 

 

Neural Network
Parameter์— ํ•ด๋‹นํ•˜๋Š” ๊ฒƒ์ด Weight์™€ Bias ๋‘ ๊ฐ€์ง€ ์ข…๋ฅ˜์˜ ์ˆซ์ž๊ฐ€ Behavior๋ฅผ ๊ฒฐ์ •ํ•  ์ˆ˜ ์žˆ๋Š” ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ๋œ๋‹ค.
 

Learning Mapping
input vector๊ฐ€ ๋“ค์–ด์™”์„ ๋•Œ ๊ทธ์— ๋Œ€์‘ํ•˜๋Š” output vector๋ฅผ ๋‚ผ ์ˆ˜ ์žˆ๋„๋ก ํ•™์Šต์„ ํ•œ๋‹ค.
์„ธ์ƒ์— ์กด์žฌํ•˜๋Š” ๋งŽ์€ ๋ฌธ์ œ๊ฐ€ ๋ฒกํ„ฐ์—์„œ ๋ฒกํ„ฐ๋กœ Mappingํ•˜๋Š” ๊ฒƒ์œผ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค.
์–ด๋–ค ๋ฌผ์ฒด๋ฅผ ์‹๋ณ„ํ–ˆ์„ ๋•Œ ๋งž์ถ”๋Š” ๋ฌธ์ œ๋„ ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„ ํ•  ์ˆ˜ ์žˆ๋‹ค.
์ž…๋ ฅ ๋ณ€์ˆ˜๊ฐ€ ๋“ค์–ด์™”์„ ๋•Œ ์ถœ๋ ฅ ๋ฒกํ„ฐ๋กœ ์–ป๊ฒŒ ๋˜๋Š” ๊ฒƒ๋„ ๋‹ค ๊ฐ€๋Šฅํ•˜๋‹ค.
์ตœ๊ทผ์—๋Š” Sequence์—์„œ Sequence๋กœ ์ด๋™ํ•˜๋Š” ๊ฒƒ๊นŒ์ง€ ๊ตฌํ˜„์ด ๋œ๋‹ค.
Sequence๋Š” ๊ธธ์ด๊ฐ€ ๊ณ ์ •๋˜์–ด ์žˆ์ง€ ์•Š๋‹ค. 

 

์ „ํ†ต์ ์ธ ๋ฐฉ๋ฒ•์€ Vector์—์„œ Vector๋กœ Mapping์„ ํ–ˆ์ง€๋งŒ ์š”์ฆ˜์€ Seq์—์„œ Seq๋กœ ์—ฐ๊ฒฐ๊นŒ์ง€ ์ง„ํ–‰ํ•˜๊ณ  ์žˆ๋‹ค.
์–ด๋–ค Text๊ฐ€ ๋“ค์–ด์™”์„ ๋•Œ ์Œ์„ฑ์‹ ํ˜ธ๋กœ ๋ฐ”๊พธ๋ฉด TTS๊ฐ€ ๋˜๊ณ  ๋ฐ˜๋Œ€์˜ ๊ฒฝ์šฐ ASR์ด ๋œ๋‹ค. ์ด๋„ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ Mapping์˜ ๋ฌธ์ œ์ด๋‹ค.
 

Learn Probability distribution
Neural Networkํ•œํ…Œ ์‚ฌ๋žŒ์˜ ์–ผ๊ตด์„ ๋ณด์—ฌ์ฃผ๊ณ  ์‚ฌ๋žŒ์„ ๋งŒ๋“ค์–ด๋ผ ํ•˜๋ฉฐ ๋น„์Šทํ•œ ํŒจํ„ด์˜ ์‚ฌ๋žŒ์„ ๋งŒ๋“ค์–ด๋‚ผ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.
์‚ฌ๋žŒ ์–ผ๊ตด์ด ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ํ™•๋ฅ  ๋ถ„ํฌ๋ฅผ ์ž์‹ ์ด ํ•™์Šตํ•œ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ๊ทธ๋Ÿฌํ•œ ํ™•๋ฅ  ๋ถ„ํฌ์— ์ž…๊ฐํ•ด์„œ ์ƒˆ๋กœ์šด output์„ ๋งŒ๋“ค์–ด๋‚ด๋Š” ๊ฒƒ์ด
Neural Network์˜ ์—ญํ• ์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค. ํ™•๋ฅ ๋ถ„ํฌ๋ฅผ ํ•™์Šตํ–ˆ์„ ๋–„ ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ๋“ค์ด ์žˆ๋‹ค.
Sample generation๊ณผ Restoration, ์™ผ์ชฝ ๋ˆˆ์„ ๋ณด์—ฌ์ฃผ๊ณ  ๋‚˜๋จธ์ง€๋ฅผ ๊ทธ๋ฆฌ๋ผ๊ณ  ํ–ˆ์„ ๋•Œ ๋ณต๊ตฌํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค.
Transformation, ํ‘๋ฐฑ ์˜์ƒ์„ ์ฃผ๊ณ  ์นผ๋ผ ์˜์ƒ์„ ๋งŒ๋“ค์–ด๋ผ๋ผ๊ณ  ํ•˜๋Š” ๊ฒƒ.
ํ•™์Šต ์—†์ด ํ•˜๋ผ๋Š” ๊ฒƒ์€ ๋ถˆ๊ฐ€๋Šฅ ํ•˜์ง€๋งŒ ๋งŽ์€ ์˜์ƒ์„ ๋ณด์—ฌ์ฃผ๊ณ  ๋‚˜์„œ ๋งŽ์€ ํ™•๋ฅ  ๋ถ„ํฌ์— ์ž…๊ฐํ•˜์—ฌ OUtput์„ ๋‚ด๊ฒŒ ๋˜๋Š” ๊ฑฐ์‹ฑ๋‹ค.
 
Perceptron Neuron
์—ฌ๋Ÿฌ ๊ฐœ์˜ ์ž…๋ ฅ์˜ weight๋ฅผ ๊ณฑํ•ด์„œ Summation์„ ํ•œ๋‹ค. Activation function์˜ ๊ฒฝ์šฐ +1 -1 0 ์˜ ํ‘œํ˜„ ๋ฐฉ์‹์„ ๊ฐ€์ง„ ๋„คํŠธ์›Œํฌ์ด๋‹ค.
Weighted Sum์ด๋ผ๋Š” ๊ฒƒ์œผ๋กœ ํ‘œํ˜„์ด ๋˜๋Š”๋ฐ ์ˆ˜ํ•™์ ์œผ๋กœ ๋ดค์„ ๋•Œ Linearํ•œ ์ƒํƒœ์ด๋‹ค.
์ฆ‰ ๋‹จ์ˆœํ•œ ๋ชจ๋ธ๋ง๋ฐ–์— ํ’€ ์ˆ˜ ์—†๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. ๋ณต์žกํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐฉ๋ฒ•์€ Layor๋ฅผ ๋งŽ์ด ์Œ“๋Š” ๊ฒƒ์ด๋‹ค. ๋งŒ์•ฝ Layor๊ฐ€ ๋‘ ๊ฐœ ์ด์ƒ์ด ์žˆ๋‹ค๊ณ  ์ƒ๊ฐํ•ด๋ณด์ž
Weighted Sum์ด ๊ณ„์† ์‹ธ์ด๊ณ  ๊ทธ๊ฒƒ์„ ์ˆ˜ํ•™์ ์œผ๋กœ ์ •์˜ํ•œ๋‹ค๋ฉด ์—ฌ์ „ํžˆ Linearํ•˜๊ฒŒ ๋œ๋‹ค.
layor๊ฐ€ ๋งŽ์€ Network๋ฅผ ์“ด๋‹ค๋ฉด ์—ฌ์ „ํžˆ Linearํ•œ ์ƒํƒœ๊ฐ€ ๋˜๊ณ  ์—ฌ์ „ํžˆ ํšจ๊ณผ๊ฐ€ ์—†๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. 
๊ทธ๋ž˜์„œ Nonlinear ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•ด์•ผ ํ•œ๋‹ค.