๋ณ์๊ฐ ์ด์ฐ์ ์ผ๋ก ๋ฐ์ํ๋์ง ์ฐ์์ ์ผ๋ก ๋ฐ์ํ๋ ์ง์ ๋ฐ๋ผ ๋ถํฌ์ ํํ๋ฅผ ๋๋ ์ ์๋ค. ํ์ฌ Parameter Estimation์ ๋ํด์ ๋ค๋ฃจ๊ณ ์์์ ๊ธฐ์ตํด์ผ ํ๋ค. ์ฌ์ค ๋ถํฌ๋ฅผ ๊ฐ์ ํ๋ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ ๋น์ฐํ Parameter Estimation์ด๋ค.
ํ๊ธฐ๋ ๋ณดํต ๋ค์๊ณผ ๊ฐ์ ๋ฐฉ์์ผ๋ก ํ๋ค. ๋ณ์, Type, Parameter๋ฅผ ์์ฑํ๋ค. ์์ ๊ฒฝ์ฐ Normal Distribution์ Type์์ ํ๊ท ๊ณผ ๋ถ์ฐ์ ํด๋นํ๋ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง๊ณ ๋ฐ์ดํฐ๋ฅผ ์ถ์ ํ๊ฒ ๋ค๋ ๋ป์ด ๋๋ค.
๋ฒ ๋ฅด๋์ด ๋ถํฌ๋ ๋ ๊ฐ์ง์ ๊ฒฐ๊ณผ๋ง์ด ๋์ค๋ ๊ฒฝ์ฐ๋ฅผ ์๋ฏธํ๋ค. ์ด ๊ฒฝ์ฐ ๋ชจ๋ธ (Likelihood)์ ๋ฐ์ํ๊ฑฐ๋ ๋ฐ์ ์ํ๊ฑฐ๋์ ํ๋ฅ ์ ํด๋นํ๋ค๊ณ ๋ณด๋ฉด ๋๋ค. ๊ทธ๋ฅ ๊ฐ๋จํ๊ฒ ๋ฐ์ํ๋ฅ ์ ๊ณ ๋ คํ๋ฉด ๋๋ค.
์ด N๋ฒ ์ํ๋๋ค๊ณ ํ์ ๋ ๊ฐ๊ฐ์ ํ๋ฅ ์ ๋ ๋ฆฝ์ด๋ฏ๋ก ํ๋ผ๋ฏธํฐ(์ธํ)์ ๋ํด ๊ณฑ์ ์ผ๋ก ํํํ ์ ์๊ณ , likelihood๋ฅผ ์์ฑํ๋ฉด ๋ค์์ฒ๋ผ ๊ณฑ์ ์ผ๋ก ํํํ ์ ์๋ค.
๋ฒ ๋ฅด๋์ด ๋ถํฌ์ Parameter Estimation์ ๊ฒฐ๋ก ์ ์ผ๋ก ์ต๋ํ์ํค๋ ํ๋ผ๋ฏธํฐ(์ธํ)๋ฅผ ์ฐพ๋ ๊ฒ์ด ๋๋๋ฐ ์ด๋ Log๋ฅผ ๋ถ์ฌ ๊ณฑ์ ์ ๋ง์ ์ผ๋ก ๋ฐ๊พธ๊ณ Max value ๊ฐ ๋๋ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฐพ์์ผ ํ๋ค. ์์์ ๋ค์๊ณผ ๊ฐ๋ค.
Head๊ฐ ๋์ค๋ฉด ๊ณ์ฐ๋๋ ํ๋ฅ 1, Tail์ด ๋์ค๋ฉด ๊ณ์ฐ๋๋ ํ๋ฅ 0์ ๋ํด ๊ฐ๊ฐ N1, N0๋ผ๊ณ ํํํ๋ฉด ๋ค์ ์์ฒ๋ผ ์์ฑํ ์ ์๋ค. ์ด๋ ์ต๋๊ฐ์ ๊ตฌํ๊ธฐ ์ํด์๋ ํ๋ผ๋ฏธํฐ(์ธํ)์ ๋ํด์ ๋ฏธ๋ถ์ ํ์ฌ 0์ด ๋๋ ๊ฐ์ ์ฐพ์์ผ ํ๋ค. ํ๋ผ๋ฏธํฐ์ ๋ํด์ ์์์ ์ ๋ฆฌํ๋ฉด ์์ ์์ฒ๋ผ ํ๋ผ๋ฏธํฐ๋ฅผ ๋์ถํ ์ ์๋ค.
Binomial Distribution์ ๊ณ ์ ๋ ํ๋ฅ ์ ํํ์ผ๋ก N๋ฒ ์ฝ์ธ์ ๋์ง๋ ๊ฒฝ์ฐ์ ๋ํ ๋ถํฌ๋ฅผ ๋งํ๋ค. ์ด๋ ๊ฐ๊ฐ์ ์ฝ์ธ์ ํ๋ฅ ์ Bernoulli ๋ถํฌ๋ฅผ ๋ฐ๋ฅธ๋ค. ์ฆ, ๋ ๊ฐ์ง์ ํ๋ฅ ๊ฐ ๋ฐ์ ์กด์ฌํ์ง ์์์ ์์์ผ ํ๋ค. N1์ Head๊ฐ ๋์ค๋ ๊ฒฝ์ฐ, N์ ์ ์ฒด ๋์ง๊ฒ ๋๋ ๊ฒฝ์ฐ์ ์, ์ธํ๋ Head๊ฐ ๋์ฌ ํ๋ฅ ์ ํด๋นํ๋ค.
Likelihood๋ฅผ ๊ตฌํ๋ผ๋ ๊ฒ์ด ์ด๋ค ๋ง์ธ์ง ์ด์ ์ดํด๊ฐ ์ข ๋ ๊ฒ์ด๋ค. ๋ถํฌ์ ์กฐ๊ฑด์ ๋ฐ๋ฅธ ๋ฐ์ ํ๋ฅ ์ ํด๋นํ๋ค๊ณ ๋ณด๋ฉด๋๋ค. Log-likelihood๋ฅผ ๊ตฌํ๋ฉด ์ง์๋ก ์ฌ๋ผ๊ฐ ํ๋ผ๋ฏธํฐ์ ๊ฐ์ด Coefficient์ฒ๋ผ ๋ด๋ ค์ฌ ์ ์๊ณ ํ๋ผ๋ฏธํฐ์ ๋ํ ๋ฏธ๋ถ์ ์งํํ๋ฉด Max ๊ฐ์ ๊ฐ์ง ๋์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ถ์ ํ ์ ์๋ค. ์์ ๋์ถ ๊ณผ์ ์ ๋ณด๋ฉด ์ดํดํ ์ ์์ ๊ฒ์ด๋ค. ์ด๋ Bernoulli ์ํ๊ณผ ๋์ผํ ๊ฒ์ ๋ณผ ์ ์๋๋ฐ ๊ทธ ์ด์ ๋ ๋น์ฐํ.. ใ ใ
Multinomial Distribution์ ์ฃผ์ฌ์๋ฅผ N ๋ฒ ๋๋ฆด ๋์ ์์๋ฅผ ๋ค๋ฉด ์ดํดํ๊ธฐ ํธํ๋ค. K๊ฐ์ ๋ฐ์ ๊ฒฝ์ฐ์ ์์ ๋ฐ๋ฅธ ๊ฐ๊ฐ์ ํ๋ฅ ์ ๊ณ์ฐํ ๊ฒ์ด๋ค. ์ฆ, ๊ฐ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๋ชจ๋ ๋ํ๋ฉด 1์ ํ๋ฅ ๊ฐ์ด ๋์์ผ ํ๋ค. ๋ถํฌ๋ ๋ค์ ์์ฒ๋ผ ๋์ฌ ๊ฒ์ด๊ณ Maximum likelihood Solution์ N๊ฐ ์ค์ Nk์ ํด๋นํ๋ ๊ฒฝ์ฐ์ ์์ ํ๋ฅ ์ด ๋์จ๋ค.
Poisson Distribution์ ํน์ ๊ธฐ๊ฐ๋์ ํ๊ท ์ ์ผ๋ก ๋ฐ์ํ ํ๋ฅ ์ ๋ํ ๋ถํฌ๋ฅผ ํํํ๋ ๋ถํฌ์ด๋ค. ๋ณ์ X์ ๋ํด์ ๊ฐ์ง๋ Likelihood ํจ์๋ ์์ ์๊ณผ ๋์ผํ๋ค. ์ง๊ธ๊น์ง ์ดํด๋ณธ ๋ถํฌ๋ ์ด์ฐํ ๋ถํฌ๋ก ์ ํ๊ฐ์ Output์ ๋ฝ์๋ด๋ ์ฌ๊ฑด์ ๋ํ ๋ถํฌ์ด๋ค.
Uniform Distribution์ ํ๋ผ๋ฏธํฐ๋ X์ถ์ ์์๊ณผ ๋ ์ง์ ์ ํด๋นํ๋ ๊ฐ์ด ๋๋ค. Density function์ด๋ผ๊ณ ํํํ๋ ๊ฒ์ Uniform Distribution์ ํ๋ฅ ๊ฐ์ ํด๋นํ๋ค๊ณ ๋ณด๋ฉด ๋๋ค.
๊ฐ์ฐ์์ ๋ถํฌ์ ํ๋ผ๋ฏธํฐ๋ ํ๊ท ๊ณผ ๋ถ์ฐ์ด๋ค. ๋ง์ด ๋ดค๋ Notation์ด๋ค. Density function์ ์ ๋ช ํ exp์ ์์ด๊ณ ํํํ๋ ๋ฐฉ์์ ์์ ์ฌ์ง๊ณผ ๊ฐ๋ค.
๊ฐ์ฐ์์ ๋ถํฌ์ Parameter estimation ๊ณผ์ ์ ์ดํด๋ณด์. ์ฐ์ Gaussian Density function์ Log๋ฅผ ๋ถ์ด๋ฉด exp์ ํด๋นํ๋ ๋ถ๋ถ์ Summation์ผ๋ก ๋ณ๊ฒฝํ ์ ์๋ค. ๊ตฌํด์ผ ํ๋ ๊ฒ์ด ๋ฌด์์ธ์ง ํญ์ ์๊ฐํด์ผ ํ๋๋ฐ, ์ญ์ parameter estimation์ด๊ธฐ ๋๋ฌธ์ ํด๋น ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ฅ ์ ํํํ ์ ์๋ ํ๋ผ๋ฏธํฐ๋ฅผ ์ถ์ ํ๋ ๊ฒ์ด๊ณ ์ด๋์ ํ๋ผ๋ฏธํฐ๋ ํ๊ท ๊ณผ ๋ถ์ฐ์ ํด๋นํ๋ค. ๋ค์์ฒ๋ผ ๊ตฌํ ์ ์์ ๊ฒ์ด๋ค.
๊ฐ์ฐ์์ ๋ถํฌ๋ ๋๊ฐ์ง ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง๊ณ ์์ด์ ํด์ํ๊ธฐ๋ ํธํ๋ฉด์ ์์ฐํ์์ ์ ํํํ๋ค๊ณ ์๋ ค์ ธ ์๋ค. Central Limit Theorem์ด๋ผ๋ ๊ฐ๋ ์ด ๋ฑ์ฅํ๋๋ฐ, ์ด ์๋ฏธ๋ ์ด๋์ ๋ ๋ง์ ์ํ์ด ์์ผ๋ฉด Normal Distribution์ ์ ๊ทผํ์ฌ ๋ถํฌํ๋ค๋ ๊ฒ์ด๋ค. roughํ๊ฒ ๊ฐ์ด๋๋ฅผ ํ๊ณ ์๋๋ฐ ๋ณดํต ์ ์ด๋ 30๊ฐ ์ด์์ ์ํ์ ๊ฐ๊ณ ์์ ๋ Central Limit Theorem์ ์ ์ฉํ๋ค.
ํํ ๋งํ๋ ์ ๊ทํ๋ผ๊ณ ๋ณด๋ฉด ๋๋ค.