๋ฐ์ดํฐ ์ํ์ ํํํ๊ธฐ ์ํด์ Vector๊ฐ ํ์ํ๊ณ , ํด๋น Dataset์ ์ดํดํ๊ธฐ ์ํด์๋ Sample์ ๋ถํด๋ฅผ ์๊ณ ์์ด์ผ ํ๋ค.
Density function ์ผ๋ก๋ถํฐ ํ๋ฅ ์ ์ถ์ ํ๋ ๋ฐฉ๋ฒ์ ๊ด์ธก๋ ๋ฐ์ดํฐ๋ค๋ก ๋ถํฐ ๊ธฐ์ํ๋ค. ๊ทธ๋ฆฌ๊ณ ๊ด์ธก๋ ๋ฐ์ดํฐ๋ค์ Density Function์ผ๋ก๋ถํฐ ์ถ์ถ๋ ๋๋ค ์ํ์ด๋ผ๊ณ ๊ฐ์ ํ๋ค.
์ ๋ต Label์ด ์๋ ๊ฒฝ์ฐ Unsupervised๋ผ๊ณ ํํ์ ํ๋ฉฐ ๊ทธ ๋ถํฌ๋ฅผ ์ ์ ์๋ค. ๋ค์ ๋งํด Population์ Density๋ฅผ ์๋ฉด ํด๋น ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ์ ์ ์๋ค๋ ๊ฒ์ด๋ค.
๊ทธ๋ฆฌ๊ณ ์ด๋ฐ Density๋ Classification์ผ๋ก ๋ฒ์ฃผํํ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉ์ด ๋๋ค. Classification์ ๊ฒฝ์ฐ ์ ๋ต Label์ด ์กด์ฌํ๋ฉฐ Baysian Thoerem์ ์ฐฉ์ํ์ฌ Class conditional Density ํ๋ฅ ์ ์ถ์ ํ ์ ์๋ค. ์ด ๊ฒฝ์ฐ parameter Conditional Density์ ํ๋ฅ ์ ๋ฐ๋๋ก ๊ตฌํ์ฌ ์ถ์ ํ ์ ์๋ค.
Parameter Method
ํ๋ผ๋ฏธํฐ์ ํ์ต์ ํตํด์ ๋ฐ์ ์์ผ ๋๊ฐ๋ ์์ ์๊ณ ๋ฆฌ์ฆ์ ์๋ฏธํ๋ค. ํ์ง๋ง ์ฌ๊ธฐ์ ๊ฒฐ์ ํด์ผ ํ ํ๋ผ๋ฏธํฐ์ ์๋ ๋ณํ์ง ์๋๋ค. ๋ํ์ ์ผ๋ก ๊ฐ์ฐ์์ ๋ถํฌ, Linear Regression, Logistic Regression, Baesian Inference ๋ฑ์ด ์๋ค.
Nonparameter Method
๋ถํฌ์ ๋ํ ์ถ์ ์ ํ์ง ์๋ ๊ฒ์ ์๋ฏธํ๋ค. ๋ฐ์ดํฐ๋ก๋ถํฐ Density๋ฅผ ๋ฐ๋ก ์ถ์ ํ๋ ๊ฒ์ ์๋ฏธํ๋ค. ์๋ฅผ ๋ค์ด Histogram, Decision Tree, Random Forest, K-nearest Neighbor Classification์ด ์๋ค. nonparameter Method๋ผ๊ณ ํ๋ผ๋ฏธํฐ๋ฅผ ์์ ์ฌ์ฉํ์ง ์๋ ๊ฒ์ด ์๋๋ผ ํ๋ผ๋ฏธํฐ์ ์ซ์๊ฐ ๊ณ ์ ๋์ด ์์ง ์๊ณ ๊ทธ ์ฑ์ง ๋ํ ๋ณํ ์๋ ์๋ค๋ ๊ฒ์ด๋ค.
Estimation Theory
์ถ์ ์ ํ๋ค๋ ๊ฒ์ ์ด๋ ํ ๋ฐ์ดํฐ๋ก ๋ถํฐ ์ ํํ Label์ ๋ํ ๋ถํฌ์ ์ฑ์ง์ ์ป์ด๋ด์ง ๋ชปํ์ง๋ง ๊ทผ์ฌ๋ฅผ ํ๋ ๊ฒ์ ์๋ฐํ๋ค๊ณ ๋ณด๋ฉด ๋๋ค. ๋ณดํต ์ถ์ ์ ์ด๋ป๊ฒ ํ๋์ง ์๊ฐ์ ํด๋ณด๋ฉด ์ธก์ ๋๋ ๋ฐ์ดํฐ์์์ ์ค์ฐจ๋ฅผ ๋ถ์ํ์ฌ ๊ทธ ์ค์ฐจ๋ฅผ ์ต์ํ ํ๋ ๋ฐฉํฅ์ผ๋ก ๊ทผ์ฌํ๊ฒ ๋๋ ๊ฒ์ ์๊ฐํ ์ ์์ ๊ฒ์ด๋ค.
Bias
ํ์ต ์๊ณ ๋ฆฌ์ฆ์์ ์ถ์ ์น์ ์ค์ฐจ๋ฅผ ์๋ฏธํ๋ค. Bias๊ฐ ๋๋ค๋ ๊ฒ์ Underfitting์ ์๋ฏธํ๊ณ ์ด๋ ๋ชจ๋ธ์ด ๋๋ฌด ๊ฐ๋จํด์ ํ์ต ์ค๋ฅ๊ฐ ์ค์ด๋ค์ง ์๋ ๊ฒ์ ์๋ฏธํ๋ค. ๋ณดํต ํ์ต์ ๋ฐ๋ณต ํ์๊ฐ ์ ๊ฑฐ๋ ๋ชจ๋ธ์ด ๋๋ฌด ๊ฐ๋จํ๊ฑฐ๋ ๋ฐ์ดํฐ์ ์์ด ๋๋ฌด ์ ์ ๊ฒฝ์ฐ ๋ค์๊ณผ ๊ฐ์ ๊ฒฝ์ฐ๊ฐ ์ผ์ด๋๊ฒ ๋๋ค.
Variance
๋ถ์ฐ์ ํด๋นํ๊ณ , ๋ฐ์ดํฐ ์์ ์์ Fluctuation์ ์ผ๋ง๋ ๋ฏผ๊ฐํ์ง๋ฅผ ํฌํจํ๊ณ ์๋ Error๋ผ๊ณ ํ ์ ์๋ค. Variance๊ฐ ๋์ ๊ฒฝ์ฐ Overfitting์ ์ถ์ธกํ ์ ์๋ค. Overfitting์ด๋ ์ค์ ๋ถํฌ๋ณด๋ค ํ์ต ์ํ ๋ถํฌ์ ๋ ๊ทผ์ ํ๊ฒ ๋๋ ํ์์ด๋ค. ๊ทธ๋์ ํ์ต ๋ฐ์ดํฐ ์ด์ธ์ ๋ค๋ฅธ ๋ฐ์ดํฐ์ ๋ํด์๋ ์ฑ๋ฅ์ ์ ๋ด์ง ๋ชปํ๋ ๊ฒ์ด ํน์ง์ด๋ค. ํ์ต ๋ฐ์ดํฐ๊ฐ ์ ๊ฑฐ๋, ๋ฐ์ดํฐ์ ํน์ฑ์ ๋นํด ๋ชจ๋ธ์ด ๋๋ฌด ๋ณต์กํ ๊ฒฝ์ฐ์ ๋ฐ์ํ๋ค.
Bias๋ ๋ฐ์ดํฐ์ ์๋ ๋ชจ๋ ์ ๋ณด๋ฅผ ํ์ฉํ์ง ์์์ผ๋ก์จ ์ง์์ ์ผ๋ก ์๋ชป๋ ๊ฒ์ ํ์ตํ๋ ๊ฒฝํฅ์ฑ์ ์๋ฏธํ๋ค. ๋ฐ๋๋ก Variance๋ ๋ฐ์ดํฐ ๋ด์ ์๋ ์์ Noise๋ Error์ ๋ฐ์ดํฐ๋ฅผ Fitting ์ํค๋ฏ๋ก์จ ์ค์ ํ์๊ณผ ๊ด๋ จ ์๋ ๊ฒ ๊น์ง ํ์ตํ๋ ๊ฒ์ ์๋ฏธํ๋ค. ์ด ๋๊ฐ์ง ํน์ง์๋ Trade Off๊ฐ ๋ฐ์ํ๊ธฐ ๋ง๋ จ์ด๋ค.
์์์ผ๋ก ์ ๋ฆฌํ๋ฉด ๋ค์๊ณผ ๊ฐ์ด ์ ๋ฆฌํ ์ ์๋ค. ๋ฐ์ํ๋ Error์ ํ๊ท ์ ๊ตฌํ๊ธฐ ์ํด์๋ ์ ๊ณฑ์ ํด์ค์ผ ์์ ๋ถํธ๊ฐ ์ฌ๋ผ์ง๊ณ ๊ทธ๊ฒ์ Expectation์ ๊ตฌํ๊ฒ ๋๋ ๊ฒฝ์ฐ bias์ variance์ ํด๋นํ๋ ๊ฐ์ ๋ง์ ์ผ๋ก ํํ์ด ๋๋ค. ์ฆ, ์ด๋ค Error๋ฅผ ์ดํด๋ณด๋ฉด Bias๊ฐ ์์ ๊ฒฝ์ฐ Variance๊ฐ ํด ์ ๋ฐ์ ์๊ณ , Bias๊ฐ ํฐ ๊ฒฝ์ฐ Variance๊ฐ ์์ ์ ๋ฐ์ ์๋ค๋ ๊ฒ์ด๋ค.
Maximum Likelihood Estimation
ํ๋ผ๋ฏธํฐ์ ๋ถํฌ๋ฅผ ์ถ์ ํ๋ ๋ฐฉ๋ฒ์ด๋ค. likelihood function์ ์ต๋ํํ๋ฏ๋ก์จ ๊ตฌํ ์ ์๋ค๊ณ ํ๋ค. (๋ค์ด์ด ๊ณ์) ๊ทธ๋ฆฌ๊ณ ๊ด์ธก๋๋ ๋ฐ์ดํฐ๋ค์ ๊ฐ์ฅ ๋ฐ์ํ ํ๋ฅ ์ด ๋์ ๊ฒ๋ค์ด๋ค. MLE๋ ํต๊ณํ์์ ๊ต์ฅํ ์ง๊ด์ ์ด๊ณ ๋ง์ด ์ฌ์ฉ๋๋ ๋ฐฉ์์ด๋ค.
Likelihood ๋ผ๋ ๊ฒ์ ์ป์ ๋ฐ์ดํฐ๊ฐ ํด๋น ๋ถํฌ๋ก ๋์์ ๊ฐ๋ฅ์ฑ์ ์๋ฏธํ๋ค. Likelihood Function์ ๋ณดํต ๋ค์๊ณผ ๊ฐ์ด ํํ์ ํ๋ค. ์ธก์ ๋ ๋ฐ์ดํฐ๋ฅผ X๋ผ๊ณ ํ๊ณ ์ถ์ ๋๋ ๋ถํฌ๋ฅผ '์ธํ' ๋ผ๊ณ ํ์ ๋ p(x|Theta)๋ก ํํํ๋ค. ๋ง์ผ ๊ด์ธก๋ ๋ฐ์ดํฐ๋ค์ด Independentํ ๊ฒฝ์ฐ ๊ฐ Likehood probability์ ๊ณฑ์ ์ผ๋ก ํํํ ์ ์๊ณ ๋ง์ง๋ง์ผ๋ก ์ถ์ ๋ถํฌ๊ฐ ๊ฐ์ฐ์์์ ๊ฒฝ์ฐ, ํ๊ท ๊ณผ ๋ถ์ฐ์ ์ด์ฉํ์ฌ ํํํ ์ ์๋ค.
Log Likelihood
log funtion์ ์ฌ์ฉํ๋ ์ด์ ๋ ๊ณ์ฐ์ ํธ์์ฑ์ ์ํจ์ด ํฌ๋ค.
๊ฐ์ฐ์์ ๋ถํฌ์ MLE
๊ฐ์ฐ์์ ๋ถํฌ์ log likelihoodํจ์๋ฅผ ๊ตฌํ๋ฉด N๊ฐ์ ์ํ ๋ฐ์ดํฐ์ ๋ํ ๊ฐ์ฐ์์ ๋ถํฌ์ ๋ก๊ทธ ํฉ์ผ๋ก ํํํ ์ ์๊ณ ์ด๋ ํ๋์ ๋ค๋ชจ ๋ฐ์ค์ฒ๋ผ ์ ๋ํ ์ ์๋ค. ๊ทธ๋ฆฌ๊ณ ์ด๊ฒ์ Maximizeํ๊ธฐ ์ํด์ ํธ๋ฏธ๋ถ์ ํ๋ฉด Derivation์ด 0์ผ ๋ ์ต๋๊ฐ ๋๋ ๊ฒ์์ ํ์ธํ ์ ์๋ค.