Density Estimation is unsupervised learning task.
unsupervised๋ ๋ฐ์ดํฐ์ ํด๋นํ๋ ๋ผ๋ฒจ์ด ์กด์ฌํ์ง ์์ ์ํ๋ก ํ์ต์ด ์งํ๋๋ ๊ฒ์ผ๋ก ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ํ์ ํ๋ ๊ฒ์ด ์ฃผ Task์ด๋ค. ๊ทธ๋์ Density Estimation์ ๋ชฉํ๋ Underlying Probablility distribution model๋ก ํด๋น ๋ฐ์ดํฐ์ ๋ถํฌ ํํ๋ฅผ ํ์ ํ๋ ๊ฒ์ด๋ค. ๊ทธ๋์ Likelihood๋ผ๋ ๊ฐ๋ ์ด ๋ฑ์ฅํ๋๋ฐ, ๋ง์์ ์ ์ ์๋ฏ์ด ๋ฐ์ดํฐ์ ๋ฐ์ํ๋ฅ ์ ์ถ์ ํ๋ ๊ณผ์ ์ด ์ฌ์ฉ๋๋ค.
Density Estimation์ ํ ๋ ํ๋์ ์ค์ํ ๊ฐ์ ์ด ์กด์ฌํ๋๋ฐ ์ด๋ IID๋ผ๊ณ ๋ถ๋ฆฌ๋ Independently Identically Distributed์ ์ฑ์ง์ด๋ค. ์ด๋ ๋ฌด์จ ๋ง์ด๋. ๊ฐ๊ฐ์ ๋ฐ์ดํฐ๊ฐ ๋ ๋ฆฝ์ด๋ฉฐ ๋์ผํ ํ๋ฅ ๋ถํฌ์์ ๋์จ ๋ฐ์ดํฐ๋ผ๋ ๋ป์ด๋ค. ๊ทธ๋ ๋ค๋ฉด ๋ ๋ฆฝ์ ์ฑ์ง์ ๋ฌด์์ธ๊ฐ? ๊ฐ๊ฐ์ ๊ณฑ์ ์ด ์ต์ข ํ๋ฅ ๊ณผ ๋์ผํ ๊ฒ. ์ฆ ๊ฐ๊ฐ์ ๋ฐ์ดํฐ๊ฐ ์๋ก์๊ฒ ์ํฅ์ ์ฃผ์ง ์๋ ํ๊ฒฝ์ ๋ฐ์ดํฐ๋ผ๊ณ ์ดํดํ๋ฉด ๋๋ค.
Density Estimation์ ๊ทธ๋ ๋ค๋ฉด ๋ฐ์ดํฐ์์ ์ด๋ค ์ข ๋ฅ์ ๋ถํฌ๋ฅผ ๋ฝ์๋ผ ์ ์์ด์ผ ํ๋๊ฐ? ๋ ๊ฐ์ง์ ๋ฐฉ๋ฒ์ผ๋ก ๋ถ๋ฅํ ์ ์๋ค. ์ฒซ ๋ฒ์งธ๋ parametric Type์ด๋ค. ํ๋ผ๋ฏธํฐ๋ผ๋ ๊ฒ์ ๋ฌด์์ธ๊ฐ. ์ด๋ ํด๋น ๋ฐ์ดํฐ๊ฐ ํน์ ๋ถํฌ์์ ๋์ถ๋์๋ค๊ณ ๊ฐ์ ํ๋ ๊ฒ์ด๋ค. ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ์ถ์ธกํ๋๋ฐ ์ด๋ค ๋ถํฌ์์ ์ถ์ถ๋์๋ค๊ณ ๊ฐ์ ํ๋ ๊ฒ์ด ์์ํ ์๋ ์๋ค. ์ ๋ฆฌ๋ฅผ ํ์๋ฉด ์ด ๋ฐฉ์์ ํด๋น ๋ฐ์ดํฐ๋ฅผ ๋ฌ์ฌํ ์ ์๋ ํ๋ผ๋ฏธํฐ (์ํ)๋ฅผ ์ถ์ ํ๋ ๊ฒ์ผ๋ก ๋ณด๋ฉด ๋๋ค. ๋ ๋ฒ์งธ๋ non parametric Type์ด๋ค. ๋ฐ๋๋ก ๋ฐ์ดํฐ๊ฐ ์ด๋ค ๋ถํฌ๋ก๋ถํฐ ๋์๋ค๋ ๊ฐ์ ์ ํ์ง ์์ ์ฑ๋ก ์งํํ๋ ๊ฒ์ด๋ค. ๊ทธ๋์ ๋ณดํต Estimate the density directly from the data๋ผ๋ ํํ์ ์ฌ์ฉํ๋ค.
Parametric Method๋ถํฐ ์ดํด๋ณด์. Parameter estimation์ ์งํํ ๋ ํฐ ๊ฐ์ ์ ํ๋ผ๋ฏธํฐ์ ๋์ํ๋ true value๊ฐ ์กด์ฌํ๋ค๊ณ ์ค์ ํ๋ ๊ฒ์ด๋ค. ์ฃผ์ด์ง ํ๋ผ๋ฏธํฐ์ ๋ฐ๋ผ ๋ณ์ X์ likelihood ํ๋ฅ ์ ๊ณ์ฐํ๊ฒ ๋๋๋ฐ ์ด๋์ ๋ชฉ์ ํจ์์ธ Objective function์ ํด๋น likelihood ํจ์๋ฅผ ์ต๋ํํ๋ Maximum Likelihood ํจ์๋ฅผ ์ฐพ๋ ๊ฒ์ด๋ค. ์ด๋ ํ๋ฅ ์ ์ต๋ํํ๋ ํ๋ผ๋ฏธํฐ (์ธํ)๋ฅผ ์ฐพ๋ ๊ณผ์ ์ด๋ผ๊ณ ์ดํดํ๋ฉด ๋๋ค. ์ด๋ ๊ณ์ฐ์ ํธ์์ฑ์ ์ํด ํด๋น Likelihood ํจ์์ log๋ฅผ ๋ถ์ฌ Log-Likelihood ํจ์๋ฅผ ์ค์ ํ๋ค.
MLE๋ ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ถ์ ํ๋ ๋ฐฉ๋ฒ ์ค์ ํ๋๋ผ๊ณ ์ดํดํ๋ฉด ๋๋ค. likelihood ํจ์๋ฅผ ์ต๋ํํ๋ ๊ณผ์ ์ ์งํํ๊ฒ ๋๋ค. ๊ทธ๋์ MLE์ ๋ชฉ์ ์ likelihood ํจ์๋ฅผ ์ต๋ํํ๋ ํ๋ผ๋ฏธํฐ (์ธํ)๋ฅผ ์ฐพ๋ ๊ฒ์ด๋ผ๊ณ ๋ณด๋ฉด ๋๋ค. IID ๊ฐ์ ์ ๊ธฐ๋ฐํ๊ธฐ ๋๋ฌธ์ ํน์ ํ๋ผ๋ฏธํฐ๋ฅผ ์กฐ๊ฑด์ผ๋ก ํ๋ ํ๋ฅ ์ Independentํ๋ฉฐ ์์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ Annotation์ผ๋ก ํํํ ์ ์๋ค. ํ์ง๋ง ์ฌ๊ธฐ์ ๊ณ์ฐ์ ํธ์๋ฅผ ์ํด Log๋ฅผ ์์ฐ๊ฒ ๋๋ฉด ๊ณฑ์ ์ด ๋ง์ ์ผ๋ก ๋ณํ๋ค.
MLE์ ๋ํด์ ๊ณ์ ์์๋ณด๊ณ ์๋ค. Log likelihood๋ผ๊ณ ํํํ ์ ์๊ณ ์์์ ๋งํ ๊ฒ์ฒ๋ผ log ๋๋ถ์ ๋ง์ ์ผ๋ก ํํํ ์ ์๋ค. Argmax๋ ๋ง์ ํ๋ผ๋ฏธํฐ ์ค ์ต๋ํํ๋ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฐพ๋๋ค๋ ๋ป์ด ๋๋ค. Log ํจ์๋ ๋จ์กฐ์ฆ๊ฐ ํจ์ ์ด๊ธฐ ๋๋ฌธ์ Increase์ Decrease ๊ตฌ๊ฐ์ ๋ณํ๋ ์๋ค.
Bayesian Parameter Estimation์ด๋ ๋ง ๊ทธ๋๋ก ๋ฒ ์ด์ง์ ํ๋ฅ ์ ์ ์ฉํ๋ ๊ฒ์ด๋ค. MLE๋ parameter set ์ค์์ ์ค์ง ํ๋๋ง์ ์ ์ ํ๋ ์๊ณ ๋ฆฌ์ฆ์ด๋ค. ํ์ง๋ง ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ ๊ฒฝ์ฐ๊ฐ ์๋๋ฐ, ์ด๋ ๋ ๊ฐ์ ํ๋ผ๋ฏธํฐ๊ฐ MLE์์ ์ ํ๋๋ ๊ฒฝ์ฐ์ด๋ค. ๊ทธ๋ผ ์ด๋ป๊ฒ ํด๊ฒฐ์ ํด์ผํ๋๊ฐ? ์ด๋ Baysian parameter Estimation์ ์ ์ฉํ๋ค. ํ๋ผ๋ฏธํฐ (์ธํ)์ ํด๋นํ๋ ์ฌํ ํ๋ฅ ์ ์ฌ์ฉํ๋ ๊ฒ์ด๋ค. ์ด๊ฒ ๋ฌด์จ ๋ง์ผ๊น. ํ๋ผ๋ฏธํฐ๋ ์ด๋ค ๋ถํฌ์์ ๋์๋ค๊ณ ๊ฐ์ ํ๋ ๊ฒ์ด๊ธฐ ๋๋ฌธ์ ํด๋น ๋ถํฌ์ ์ฌ์ ํ๋ฅ ์ ์ด์ฉํ์ฌ ๊ณ์ฐํ๊ฒ ๋ค๋ ๋ป์ด๋ค.
Baysian Parameter Esitmation์ ์ฌ์ ํ๋ฅ ์ด ํ๋ผ๋ฏธํฐ์ ๊ฐ๋ฅํ ๊ฐ๋ค์ ๋ชจ๋ ์ปค๋ฒํ ์ ์๋ค๋ ํํ์ด ์๋ค. (์์ง ์ ์ดํด๋ฅผ ๋ชปํ๊ฒ ๋ค..)