๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿš“ Self Study/๐Ÿ”ด Machine Learning

[๋ฐฉํ•™ ์ค‘ ๊ณต๋ถ€] Machine Learning. Information Theory #1 - laws of thermodynamics, entropy, asymptotic property of entropy

by UKHYUN22 2022. 8. 10.
728x90

์—ด์—ญํ•™ ์ œ 1์˜ ๋ฒ•์น™

: ๋‹ซํžŒ๊ณ„์—์„œ ๋ชจ๋“  ์—๋„ˆ์ง€์˜ ์ดํ•ฉ์€ ๋ณ€ํ•˜์ง€ ์•Š๋Š”๋‹ค. 

Rudolf Kausius์— ์˜ํ•ด์„œ ์—๋„ˆ์ง€ ๋ณด์กด ๋ฒ•์น™์ด ์ฆ๋ช…๋˜์—ˆ๋‹ค.

 

์—ด์—ญํ•™ ์ œ  2์˜ ๋ฒ•์น™

: ์—ด์—ญํ•™์˜ ์ฒด๊ณ„ ์•ˆ์—์„œ ์—”ํŠธ๋กœํ”ผ๋Š” ํ•ญ์ƒ ์ฆ๊ฐ€ํ•œ๋‹ค.

์—ฌ๊ธฐ์„œ ์—”ํŠธ๋กœํ”ผ๋ž€ ํ•˜๋‚˜์˜ ์ฒด๊ณ„ ์†์—์„œ ๋ฌด์ž‘์œ„์„ฑ์ด๋‚˜ ๋ฌด์งˆ์„œ๋„๋ฅผ ํ‘œํ˜„ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ์ •์˜๊ฐ€ ๋œ๋‹ค. 

Information theory๋ž€ ๋ฌด์—‡์ธ๊ฐ€.

๋งŽ์€ ๋‚ด์šฉ์˜ ์ •๋ณด๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๋ถˆํ™•์‹คํ•œ ๊ฒƒ์ด๋‹ค. ์ฆ‰, ์ž์ฃผ ์ผ์–ด๋‚˜์ง€ ์•Š๋Š” ์‚ฌ๊ฑด์˜ ์ •๋ณด๋Ÿ‰์ด ์ž์ฃผ ์ผ์–ด๋‚˜๋Š” ์‚ฌ๊ฑด์— ๋Œ€ํ•œ ์ •๋ณด๋Ÿ‰๋ณด๋‹ค ๋งŽ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. Claude Shannon์€ Information Theory์˜ ์•„๋ฒ„์ง€๋ผ๊ณ  ๋ถˆ๋ฆฌ๋ฉฐ Informatiton์„ Quantity๋ผ๊ณ  ์ •์˜ํ•˜๊ณ  ์žˆ๋‹ค. 

 

Degree of f Surprise

์ •๋ณด์˜ ๊ฐœ๋…์„ ๊ตฌ์ฒดํ™”ํ•˜๊ธฐ ์œ„ํ•œ ์šฉ์–ด๋ผ๊ณ  ์•Œ๊ณ  ์žˆ์œผ๋ฉด ๋˜๋ฉฐ, ํ•™์Šต์— ์žˆ์–ด ํ•„์š”ํ•œ ๋†€๋žŒ์˜ ์ •๋„๋กœ ํ•ด์„ํ•œ๋‹ค. 

๋ณดํ†ต ์ •๋ณด์˜ ์–‘์„ ๋‚˜ํƒ€๋‚ด๋Š” h(x)๋Š” ์‚ฌ๊ฑด์ด ๋ฐœ์ƒํ•  ํ™•๋ฅ  p(x)์˜ ์Œ์˜ ๋กœ๊ทธ๊ฐ’์œผ๋กœ ํ‘œํ˜„ํ•œ๋‹ค. 

 

Entropy

 

 ์ •๋ณด๊ฐ€ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ์˜ˆ์ธก ๋ถˆ๊ฐ€๋Šฅํ•œ ์ •๋„๋ฅผ ํ‘œํ˜„ํ•œ๋‹ค. X๊ฐ€ ์ธก์ •๋˜์—ˆ์„ ๋•Œ ์ด์ „์— Degree of  Surprise์˜ ๊ฐœ๋…์„ ํ™œ์šฉํ•˜์—ฌ ์ •๋ณด์˜ ์–‘์„ ํ•ด๋‹น ์‚ฌ๊ฑด์ด ๋ฐœ์ƒํ•  ํ™•๋ฅ ์„ ์ด์šฉํ•˜์—ฌ ์Œ์˜ ๋กœ๊ทธ๊ฐ’์œผ๋กœ ํ‘œํ˜„์„ ํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  P(x)๋ฅผ ํ™œ์šฉํ•˜์—ฌ ํ•ด๋‹น ์ •๋ณด์˜ ์ด ํ•ฉ์„ ๊ณ„์‚ฐํ•˜์—ฌ ์ด์‚ฐ ๋ฐ์ดํ„ฐ์™€ ์—ฐ์† ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์—”ํŠธ๋กœํ”ผ๋ฅผ ํ‘œํ˜„ํ•  ์ˆ˜๊ฐ€ ์žˆ๋‹ค. 

 

 ๋งŒ์•ฝ ์‚ฌ๊ฑด์ด ๋ฐœ์ƒํ•  ํ™•๋ฅ ์ด 0 (์•„์˜ˆ ๋ฐœ์ƒํ•˜์ง€ ์•Š์„ ํ™•๋ฅ ) ๋˜๋Š” 1 (ํ•ญ์ƒ ๋ฐœ์ƒํ•˜๋Š” ๊ฒฝ์šฐ) ์ด๋ผ๋ฉด ์—”ํŠธ๋กœํ”ผ์˜ ๊ฐ’์€ 0์ด ๋œ๋‹ค. Degree of Surprise์˜ ๊ฐœ๋…์„ ํ™œ์šฉํ•˜์—ฌ Value of surprise๋ฅผ ๋„์ถœํ•  ์ˆ˜ ์žˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๋…๋ฆฝ์ ์ธ ์‚ฌ๊ฑด์—์„œ ์ •๋ณด๋ฅผ ๊ฐ€์ ธ์™”๋‹ค๋ฉด additive๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค. (Additive : Combined effects of two or more chemicals is equal to  the sum of each effects). ๊ทธ๋ฆฌ๊ณ  ์ •๋ณด๋Š” ์Œ์˜ ๊ฐ’์„ ๊ฐ€์ง€์ง€ ๋ชปํ•œ๋‹ค. 

 

Binary Case์— ๋Œ€ํ•œ Entropy๋ฅผ ์ƒ๊ฐํ•ด๋ณด์ž.

 

๋™์ „์„ ๋˜์ง€๊ฒŒ ๋˜๋Š” ๊ฒฝ์šฐ ์•ž๋ฉด์ด ๋‚˜์˜ค๋Š” ๊ฒฝ์šฐ์˜ ํ™•๋ฅ ์„ p๋ผ๊ณ  ํ•ด๋ณด์ž. ๊ทธ๋ ‡๋‹ค๋ฉด ๋™์ „์˜ ์—”ํŠธ๋กœํ”ผ๋Š” ์œ„์— ๋ณด์ด๋Š” ์‹์ฒ˜๋Ÿผ ์ •์˜๋  ์ˆ˜ ์žˆ๋‹ค. ์•ž๋ฉด์ด ๋‚˜์˜ค๊ฒŒ ๋˜๋Š” ๊ฒฝ์šฐ์™€ ๋’ท๋ฉด์ด ๋‚˜์˜ค๊ฒŒ ๋˜๋Š” ๊ฒฝ์šฐ์˜ ์—”ํŠธ๋กœํ”ผ์˜ ํ•ฉ์ด ๋œ๋‹ค. (์Œ์˜ ๋กœ๊ทธ ๊ฐ’์œผ๋กœ ํ‘œํ˜„์ด ๋˜๋ฏ€๋กœ ์Œ์˜ ๊ฐ’์ฒ˜๋Ÿผ ๋ณด์ด์ง€๋งŒ ์–‘์˜ ๊ฐ’์„ ๊ฐ€์ง„๋‹ค.)  ๋ณ€ํ™˜๊ณผ์ •์ด๋ผ๊ณ  ์ ์€ ๊ณณ์—์„œ - ๋ถ€ํ˜ธ๋ฅผ log์˜ ์ง€์ˆ˜๋กœ  ์˜ฌ๋ ค์„œ ํ™•๋ฅ ์˜ ์—ญ์ˆ˜ ๊ฐ’์„ ์ทจํ•˜๊ฒŒ ๋œ๋‹ค. ์—ฌ๊ธฐ๋„ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ๋ฐœ์ƒํ•  ํ™•๋ฅ ์ด 0 (์•„์˜ˆ ๋ฐœ์ƒํ•˜์ง€ ์•Š๋Š” ๊ฒฝ์šฐ) ๋˜๋Š” 1 (ํ•ญ์ƒ ๋ฐœ์ƒํ•˜๋Š” ๊ฒฝ์šฐ)๋Š” ์—”ํŠธ๋กœํ”ผ๊ฐ€ 0์ด ๋œ๋‹ค. 

thermodynamic entropy

 

Boltzmann ๊ณผ Gibbs์— ์˜ํ•ด์„œ ์ •์˜ ๋˜์—ˆ์ง€๋งŒ ์‹ค์ œ๋กœ ์‚ฌ์šฉ๋  ๋•Œ ๊ณ„์ˆ˜์™€ ๋กœ๊ทธ ํ•จ์ˆ˜์˜ ๋ฐ‘์˜ ์ฐจ์ด๊ฐ€ ์žˆ๋‹ค๋Š” ์ ์ด ์ฐจ์ด์ ์ด๋‹ค.

 

Coding Theory

 

8๊ฐœ์˜ ์ƒํƒœ๋ฅผ ๋‚˜ํƒ€๋‚ด๊ธฐ ์œ„ํ•ด์„œ๋Š” ํ”ํžˆ ์•Œ๊ณ  ์žˆ๋“ฏ 3bit๊ฐ€ ์กด์žฌํ•ด์•ผ 2^3 ๋งŒํผ ํ‘œํ˜„์ด ๊ฐ€๋Šฅํ•œ ๊ฒƒ์œผ๋กœ ์•Œ๊ณ  ์žˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์—”ํŠธ๋กœํ”ผ๋ฅผ  ๊ณ„์‚ฐ์„ ํ•ด๋ณด๋ฉด ๋™์ผํ•˜๊ฒŒ 3bit๊ฐ€ ๋‚˜์˜ค๋Š” ๊ฒƒ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค. ํ•˜์ง€๋งŒ Uniform Distribution์ด ์•„๋‹ˆ๋ผ ๋ฐœ์ƒํ•  ํ™•๋ฅ ์ด ๊ฐ๊ฐ ๋‹ค๋ฅธ ๊ฒฝ์šฐ๋ฅผ ์ƒ๊ฐํ•ด๋ณด์ž. ์œ„์˜ ํ‘œ์ฒ˜๋Ÿผ ํ™•๋ฅ ์ด ๋‹ค๋ฅด๋‹ค๋ฉด ์—”ํŠธ๋กœํ”ผ๋ฅผ ๊ณ„์‚ฐํ–ˆ์„ ๋•Œ 2์˜ ๊ฐ’์ด ๋‚˜์˜ฌ ์ˆ˜ ์žˆ์Œ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค,. 

 

์ฆ‰, ์ƒํƒœ๋ฅผ ํ‘œํ˜„ํ•˜๋Š”๋ฐ 3bit๊ฐ€ ํ‰๊ท ์ ์œผ๋กœ ํ•„์š”ํ•˜์ง€ ์•Š์Œ์„ ์•Œ ์ˆ˜ ์žˆ๋‹ค. code์˜ ๊ธธ์ด๋งŒ์„ ๋†“๊ณ   ๋ณด์•˜์„ ๋•Œ๋„ ํ‰๊ท  2bit๊ฐ€ ํ•„์š”ํ•œ ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ๊ณ , ์—ฌ๊ธฐ์„œ ์ค‘์š”ํ•œ ๊ฒƒ์€ ์—”ํŠธ๋กœํ”ผ๊ฐ€ ๋žœํ…€ Variable์„ ์ „์†กํ•˜๋Š” ๋ฐ์˜ Lower bound ๋กœ ๊ณ„์‚ฐ๋˜๋Š” ๋น„ํŠธ๋ฅผ ํ‘œํ˜„ํ•œ๋‹ค๋Š” ์ ์ด๋‹ค.

 

๋ถ„ํฌ๊ฐ€ ๋” ๊ท ์ผํ•  ์ˆ˜๋ก ์—”ํŠธ๋กœํ”ผ๊ฐ€ ์ฆ๊ฐ€ํ•œ๋‹ค. ๋‹ค์‹œ ๋งํ•ด ๊ท ๋“ฑ๋ถ„ํฌ๋Š” ์ œํ•œ๋œ ๋ฒ”์œ„ ๋‚ด์—์„œ ์ตœ๋Œ€์˜ ์—”ํŠธ๋กœํ”ผ๋ฅผ ๊ฐ€์ง„๋‹ค. ๋ฐ˜๋ฉด ๊ฐ€์šฐ์‹œ์•ˆ ๋ถ„ํฌ๋Š” ์ œํ•œ์ ์ธ ํ‰๊ท ๊ณผ ๋ถ„์‚ฐ์„ ๊ฐ€์ง€๊ณ  ๋ฌดํ•œํ•œ ๋ฒ”์œ„ ์•ˆ์—์„œ๋Š” ์ตœ๋Œ€์˜ ์•คํŠธ๋กœํ”ผ๋ฅผ ๊ฐ€์ง„๋‹ค.