๊ท ๋ฑ๋ถํฌ๋ Maximum Entropy Distributiton์ ๊ฐ์ง๋ค.
[a,b]๋ผ๋ ์ ํ๋ ๋ฒ์์์ ์ต๋์ ์คํธ๋กํผ๋ฅผ ๊ฐ์ง๋ ๋ถํฌ๋ฅผ ์ฐพ๋ ๊ณผ์ ์ ์งํํด๋ณด์. ์ํธ๋กํผ์ ๊ฒฝ์ฐ ์์ ๋ก๊ทธ๊ฐ์ ๊ฐ์ง๋ฉฐ (Degree of Surprise) ์ฐ์์ ์ธ ๊ฒฝ์ฐ ์์ ๊ฐ์ด ํํ๋๋ค. ์ด๋ Constraint๋ [a,b]์์ ๋ชจ๋ ํ๋ฅ ์ ๋ํ๋ฉด 1์ด ๋๋ค๋ ์ ์ด๋ค. Lagrange ๊ณฑ์ ์ ์งํํ๋ฉด ํ๋ฅ ๊ฐ์ด ๊ท ๋ฑ๋ถํฌ์์ ๋์ถํ ์ ์๋ ๊ฐ์ ๊ฐ์ง๋ค.
Marginal Entropy์ ๊ฒฝ์ฐ ์์ ๊ณ์ฐํ ๊ฒ ๊ณผ ๋์ผํ ์คํธ๋กคํผ์ ๊ณ์ฐ์์ด๋ฉฐ ์๊ทธ๋ง์ ๊ฒฝ์ฐ ์ด์ฐ์ ์ธ ๊ฒฝ์ฐ์ ๋ํ ํํ์ด ๋๋ค. Joint Entropy์ ๊ฒฝ์ฐ ๋ ๊ฐ์ง ์ด์์ ํ๋ฅ ์ด ๊ฒฐํฉ๋์ด ์๋ ๊ฒฝ์ฐ๋ผ๊ณ ๋ณผ ์ ์๊ณ Conditional Entropy์ ๊ฒฝ์ฐ ํํ ์๊ณ ์๋ ์กฐ๊ฑด๋ถ ํ๋ฅ ์ ์ฌ๋ก๊ฐ ๋๋ค. ์คํธ๋กํผ์ ๊ฒฝ์ฐ ์ด๋ ๊ฒ Marginal, Joint, Conditional Entropy ๊ฐ์ ์๊ด ๊ด๊ณ๊ฐ ์๋๋ฐ ์ด๋ฅผ ๋ค์ ํ์ด์ง์์ ์ฆ๋ช ํ๋ค.
ํํ ์๊ณ ์๋ Joint Probability๋ฅผ Conditional Probability๋ก ํํํ๋ ๊ณผ์ ์ ์งํํ๋ฉด์ ์ฆ๋ช ๋๋ค. ๋ ธ๋์ ๋ฐ์ค๋ฅผ ๋ณด๋ฉด ๋งจ์ฒ์ Joint Entropy๋ฅผ ๊ณ์ฐํ๋ ์์์ ์ถ๋ฐํ๋ฉฐ Joint Probability๋ฅผ ๊ณ์ฐํ๋ ์์์ ํ์ด์ Marginal๊ณผ Conditional Probability๋ก ์นํํ๋ ๊ณผ์ ์ ๊ฑฐ์น๋ค. ๋ง์ง๋ง์ผ๋ก ์ ๋ฆฌ๋ฅผ ํ๋ฉด ๋ค์๊ณผ ๊ฐ์ ๊ด๊ณ์์ ๋์ถํ ์ ์๋ค.
Relative ์คํธ๋กํผ
Relative ์คํธ๋กํผ๋ผ๊ณ ๋ถ๋ฆฌ๋ฉฐ ์ด๋ ๋ ํ๋ฅ ๋ถํฌ P์ Q์ ๋ฐ์ฐ ์ ๋๋ฅผ ์ ์ ์๋ค. ๋ณดํต ๋ ํ๋ฅ ๋ถํฌ์ ์ฐจ์ด๋ฅผ ๊ณ์ฐํ ๋ ์ฌ์ฉ์ด ๋๋ฉฐ ์ด๋ค ์ด์์ ์ธ ๋ถํฌ๋ฅผ ๊ตฌํ๊ณ ์ ํ ๋ ํด๋น ๋ถํฌ์ ๊ทผ์ฌํ๋ ๋ค๋ฅธ ๋ถํฌ๋ฅผ ์ด์ฉํ์ฌ Samplingํ๋ ๊ฒฝ์ฐ ๋ฐ์ํ๋ ์ฐจ์ด๋ฅผ ๊ณ์ฐํ ๋ ์ฌ์ฉ์ด ๋๊ธฐ๋ ํ๋ค. ์ง๊ด์ ์ผ๋ก ๋ณธ๋ค๋ฉด P์ Q๋ถํฌ์ Cross Entropy๋ฅผ ๊ณ์ฐํ๊ณ ์ฌ๊ธฐ์ P๋ถํฌ์ Entropy๋ฅผ ๋นผ์ค๋ค๋ฉด ๋ ํ๋ฅ ๋ถํฌ ๊ฐ์ ์ฐจ์ด๋ฅผ ๊ณ์ฐํ ์ ์๋ค๊ณ ๋ณผ ์ ์๋ค.
[์ถ์ฒ ์ธ์ฉ, ์ฐธ๊ณ : https://hyunw.kim/blog/2017/10/27/KL_divergence.html ]
ํ๋ผ๋ฏธํฐ๋ฅผ ์ฌ์ฉํ๊ณ Empirical Approach๋ฅผ ํตํด ๋ชจ๋ธ Q๋ฅผ ์ฐพ๋ ์์์ ์ดํด๋ณด๋ฉด, Basian Theory์ฒ๋ผ Posterior์ ํ๋ฅ ์ ๊ตฌํ ๋ Conversion ํ์ฌ ์ฌ์ฉํ๋ ๊ฒ๊ณผ ์ ์ฌํ๋ค๊ณ ์๊ฐํ๋ค.
KL Divergence
KL Divergence๋ Asymmetric์ด์ฌ์ KL(p||q) ์ KL(q||p)์ ๊ฐ์ด ๋ค๋ฅด๋ค. ๊ทธ๋ ๊ธฐ ๋๋ฌธ์ ์ง๊ด์ ์ผ๋ก ๋ ๋ถํฌ์ ๊ฑฐ๋ฆฌ ์ฐจ์ด์ธ ๊ฒ์ฒ๋ผ ๋ณด์ด์ง๋ง