Binary Class๋ฅผ ๊ตฌ๋ถํ ์ ์๋ ํจ์๋ฅผ ์ด๋ป๊ฒ ์ฐพ์ ์ ์์์ง ์๊ฐํด๋ณด์. ๊ฐ Input Data์ ํด๋นํ๋ Label์ด ์ฃผ์ด์ง ์ํ๋ผ๊ณ ํ์ ๋ ์์ผ๋ก ๋ค์ด์ฌ Data์ ๋ํด์ ๋ถ๋ฅํ ์ ์๋ ํจ์๋ฅผ ์ฐพ๋ ๋ฐฉ๋ฒ์ ๋ํ ์ค๋ช ์ด๋ค. ๋ง์ผ ํ์ 5๊ฐ์ ๋ฐ์ดํฐ๊ฐ ์๋ค๋ฉด ์ด ๋ถํฌ๋ฅผ Regressionํ ์ ์๋ ์ ์ ํ๋ ๊ธ๊ณ ๋ฐ๋์ Label์ ์ฃผ์ด Regression์ ํ๋ ์ ์ ํ๋ ๊ธ๊ฒ ๋๋ค. ๊ทธ๋ ๊ฒ ๋๋ฉด ์ ์ด 2๊ฐ๊ฐ ์๊ธฐ๊ฒ ๋๋๋ฐ ์ด๋ฅผ ๊ธฐ์ค์ผ๋ก Class 2๊ฐ์ ๋ํด ํ๋ณํ๋ ํจ์๋ฅผ ๋ง๋ค ์ ์๋ค.
๋ ๋ฒ์งธ๋ก ํจ์๋ฅผ ์ค์ ํ๋ ๋ฐฉ์์ผ๋ก๋ label์ด 0์ธ ๊ฒ๋ค์ ์คํ๋ ค -1๋ก ๋ฐ๊พธ์ด ๋ ํ์คํ Regression์ ๋ง๋ค์ด์ฃผ๋ ๋ฐฉ์์ด๋ค. ์ด๋ ๊ฒ ๋๋ ๊ฒฝ์ฐ๋ Binary Classification์ ์ญํ ์ ์ถฉ๋ถํ ํ ์ ์๋ค.
ํ๊ณ์ ์ผ๋ก 2๊ฐ์ง๊ฐ ์กด์ฌํ๋ค. ํ๋ฅ ์ ์ผ๋ก Linear Regression์ ๊ฐ์ฐ์์ ๋ถํฌ๋ฅผ ๋ฐ๋ฅด์ง๋ง ์ฐ๋ฆฌ๋ ์ค์ง 2๊ฐ์ ํ๊ฒ Value๊ฐ ์๋ค๋ ๊ฒ์ด๊ณ ๋ ๋ฒ์งธ๋ก๋ ์ฌ์ค ์ฐ๋ฆฌ๋ ๋ชจ๋ธ์ ํ๋ฅ ์ ์ผ๋ก ํํํ ์ ์์ด์ผ ํ๋๋ฐ ์ด๊ฒ์ด ๊ฐ๋ฅํ๊ฐ์ ๋ํ ํ๊ณ์ ๋ ์กด์ฌํ๋ค.
๊ทธ๋์ ๋ฑ์ฅํ ๊ฒ์ด Logistic Regression์ด๋ค. ์ง๊ธ๊น์ง ์ฃผ์ด์ง ๋ผ๋ฒจ ๋ฐ์ดํฐ๋ฅผ ์ญ์ผ๋ก ๋ง๋ค๊ฑฐ๋ ์์๋ฅผ ์ทจํด์ regression์ ํ๋ ๋ฐฉ๋ฒ์ผ๋ก ์ ๊ทผ์ ํ์๋ค๋ฉด ํจ์๋ฅผ ๋์ ํ์ฌ ํด๋์ค๋ฅผ ๋ถ๋ฅํ์๋ ๊ฒ์ด๋ค. Sigmoid๋ผ๋ ํจ์๋ฅผ ์ฌ์ฉํ๊ฒ ๋ ๊ฒ์ธ๋ฐ ์ด๋ 0๊ณผ 1 ์ฌ์ด์ ๋ฒ์๋ฅผ ๊ฐ์ง๋ ํ๋ฅ ๊ฐ์ผ๋ก ๋ชจ๋ธ์ ํํํ ์ ์๋ค. Linear Regression์ ํ๊ฒ ๋๋ฉด ์ง์ ์ผ๋ก ํํ๋์ด 0๋ณด๋ค ์๋, 1๋ณด๋ค ํฐ ์ง์ ์ด ์๊ธฐ๋๋ฐ ์ด ๋ถ๋ถ์ด ์ธ๋ชจ ์๋ ๋ถ๋ถ์ด๋ผ๋ ์ ์ ์ฐฉ์ํ์ฌ 0๊ณผ 1์ ๋ฒ์ด๋์ง ์๋ ๋ฒ์์์ ํ๋ฅ ๋ก ํํํ ์ ์๋ ๋ชจ๋ธ์ ๋ง๋ค๊ณ ์ ํ๋ ๊ฒ์ด๋ค.
Logistic ํจ์๋ฅผ Sigmoid ํจ์๋ผ๊ณ ์ด์ ๋ถ๋ฅธ๋ค. Sigmoid ํจ์์์ด ๋์ถ๋๋ ๊ณผ์ ์ ์ดํด๋ณด๋ฉด ์ด๊ธฐ์ ํ๋ฅ ๊ฐ์ผ๋ก ํํํ๋ ๊ฒ์ p์ (1-p)์ ๋น์จ๋ก ํํ์ด ๋๊ณ ์ด๊ฒ์ Log ํจ์๋ฅผ ๋ฐํ์ผ๋ก ํ๋ค. ํด๋น log ํจ์๋ฅผ Linear regression์ผ๋ก ํํํ๊ณ ์ ๋ฐฉ์ ์์ ์ธ์ฐ๊ฒ ๋๋ฉด ๊ฒฐ๊ตญ P์ ๋ํด์ ํํ์ ํ ์ ์๋ค. ์ด๋ ๊ฒฐ๊ตญ X ๋ฐ์ดํฐ๊ฐ ์ฃผ์ด์ก์ ๋ Y๊ฐ 1์ผ ํ๋ฅ ์ ํํํ๋ ๊ฒ์ผ๋ก ํด์๋ ์ ์๋ค.
Linear regression์ ๋ํ Logistic function์ ๋์ ์ ํ๋ฉด 0๊ณผ 1์ฌ์ด์ ํ๋ฅ ๊ฐ์ผ๋ก ํํํ ์ ์๊ณ Threshold ๊ฐ์ ๋ฐ๋ผ ํด๋์ค๋ฅผ ๋ถ๋ฅํ ์ ์๋ ๋ชจ๋ธ์ด ์์ฑ๋๋ค.
'๐ Major Study (Bachelor) > ๐ฅ Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Logistic Regression (0) | 2022.12.08 |
---|---|
Linear Discriminant Analysis(LDA) Approach (0) | 2022.12.05 |
Stochastic Gradient Descent, Regularization(L2 Ridge, L1 Lasso) (0) | 2022.12.05 |
Linear Regression, Approach in SLE, probabilistic, Gradient Descent (0) | 2022.12.05 |
Gradient Descent Method (RSS, RMSE, Coefficient of determination) (0) | 2022.11.02 |