z๋ผ๋ ๊ฐ์ด Weight์ Input์ ๋ด์ ํ Linear Regression์ด๊ณ ์ด ๊ฐ์ด Sigmoid ํจ์์ Input ๊ฐ์ผ๋ก ๋ค์ด๊ฐ๋ค. ์ฌ์ค P๋ผ๋ ํ๋ฅ ๊ณผ P๊ฐ ์๋ 1-P์ ํ๋ฅ ์ ๋น์จ๋ก ํํ๋ ์ ์๋ ๊ฒ์ Log๋ฅผ ์ทจํ ํ P์ ๋ํด์ ํํ์ ํ๋ฉด Sigmoid ํจ์๊ฐ ๋์ค๊ฒ ๋๋ค. ์ฆ ํ๋ฅ ๊ฐ์ 0๋ถํฐ 1 ์ฌ์ด์ ๊ฐ์ผ๋ก ํํ์ ํ๊ณ Binary Decision์ ํ๊ธฐ ์ํจ์ด๋ค.
Logistic Regression์ด๋ผ๋ ๊ฒ์ ๊ทธ๋ผ ์ด๋ป๊ฒ ๋ฐ์ดํฐ๋ฅผ ํ๊ธฐํ๋ ๋ฐฉ๋ฒ์ผ๊น? Linear Regression์ด๋ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ๊ฐ์ฅ ์ ํํํ๋ ์ ํ๋๋ฅผ ๊ธ๋ ๊ณผ์ ์ด๋ผ๊ณ ๋ณด๋ฉด ๋๋ค. ๊ทธ๋ผ Logistic์ ๋ป์ ์ฌ๊ธฐ์ ๋ ๋์๊ฐ Class๋ฅผ ๋ถ๋ฅํ๊ธฐ ์ํ ํ๋ฅ ๋ชจ๋ธ์ ๋ง๋ค๊ณ ์ ํ๋ ๊ฒ์ด๋ค. ๊ทธ๋์ F๋ผ๋ ํจ์๋ฅผ Sigmoid ํ๊ธฐ๋ฅผ ํตํด์ ํํ์ ํ ์๋ ์๊ณ , ํด๋์ค๊ฐ 1์ผ ํ๋ฅ P๋ก ํํํ ์๋ ์๋ค. ๊ทธ๋์ ํ๋ฅ ์ด ์ ํด์ง๊ณ Threshold์ธ 1/2๋ณด๋ค ํฐ ๊ฐ์ด๋ฉด ํด๋์ค 1์ ์ ํํ๊ณ ์๋๋ฉด ํด๋์ค 0์ ์ ํํ๋ ๋ถ๋ฅ๊ธฐ๋ฅผ ๋ง๋ค๊ฒ ๋๋ค.
๊ทธ๋ฆผ์ ๋ณด๋ฉด Linear Regression์ ํตํด์ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ์ ๊ฐ๋ฅผ ์ ์๋ ์ ์ ํ๋ ์ฐพ๊ฒ ๋๊ณ ์ด์ ๋ํ ํ๋ฅ ๋ชจ๋ธ์ ๋ง๋ค์ด์ 1/2 ๊ฐ๋ณด๋ค ํฐ ๊ฒฝ์ฐ์ ์์ ๊ฒฝ์ฐ์ ๋ํด์ ํด๋์ค๋ฅผ ๋๋ ์ ์์์ ์ ์ ์๋ค.
Logistic Regression์ Binary Class๋ฅผ ๊ตฌ๋ถํ๊ธฐ ์ํ ์์ ์ผ๋ก ์ดํดํด๋ ๋๋ค. ๊ทธ๋์ Train์ ํ๊ฒ ๋ ๊ฒฝ์ฐ Likelihood ํจ์๋ฅผ ๋ณด๋ฉด ๋ฒ ๋ฅด๋์ด ํ๋ฅ ์ฒ๋ผ ํํ๋๋ ๊ฒ์ ์ ์ ์๋ค.
์ด ๊ฒฝ์ฐ Objective function๊ณผ ํท๊ฐ๋ฆฌ์ง ๋ง์. Objective Function์ MSE๋ฅผ ์ต์ํํ๊ธฐ ์ํ ์์ ์ ์งํํ๋ฏ๋ก ๋ฏธ๋ถ์ ํ์ฌ 0์ด ๋๋ ์ง์ ์ ์ง์ค์ ํ๋ค. ํ์ง๋ง ์ด ๊ฒฝ์ฐ ๋ฐ์ํ ํ๋ฅ ์ ์ต๋๊ฐ์ ๊ตฌํด์ผ ํ๋ฏ๋ก Log-likelihood ๊ฐ๋ ์ ์ ์ฉํ์ฌ ์ต๋ํํ ์ ์๋ ์ง์ ์ ์ฐพ๊ฒ ๋๋ค.
Training์ ๋ชฉ์ ์ Log-likelihood ํจ์๋ฅผ ์ต๋ํํ ์ ์๋ Weight๋ฅผ ์ฐพ๋ ๊ณผ์ ์ด๋ค. ํ๋ฅ ์ ๊ณฑ์ ์ด Log์ ์ํด์ ๋ง์ ์ผ๋ก ๋ณ๊ฒฝ๋๊ณ ๋ฏธ๋ถ์ ํตํด 0์ด ๋๋ ์ง์ ์ ์ง์ค์ ํ๋ค. ์ด ๊ฒฝ์ฐ Gradient Descent ์ฒ๋ผ Weight๋ฅผ ์ต์ ํํด์ผ ํ๋๋ฐ Logํจ์๋ฅผ ์ต๋ํํ๊ธฐ ์ํด์๋ ํ์ฌ์ Weight๋ฅผ ์ฆ๊ฐ์์ผ์ผ ํ๋ค. ๊ทธ๋ ๊ธฐ ๋๋ฌธ์ Gradient ascent๋ฅผ ํ๊ฒ๋๋ค๋ ์ฐจ์ด์ ์ ๊ธฐ์ตํ์.
์์๋ฅผ ์ทจํ๊ฒ ๋๋ ๊ฒฝ์ฐ Gradient Descent์ฒ๋ผ ํํํ ์ ์๋ค.
Logistic Regression์ Non-linear ํน์ฑ์ ํ์ฅ์ํฌ ์ ์๋๊ฐ. ์ฒ์ ๋ค์ด์ค๋ Input Data์ธ X๋ฅผ ๋คํํจ์๋ฅผ ํต๊ณผํ์ฌ Non linearity ์ฑ์ง์ ๊ฐ์ง๋๋ก ๋ถ์ฌํ๋ค. ์ดํ Weight์ Mult, Sum์ ํด์ Sigmoid ํจ์์ Input์ผ๋ก ๊ฐ์ ์ฃผ๊ฒ ๋๋ ๊ฒฝ์ฐ๋ฅผ ์๊ฐํด๋ณด์.
Non lineariy ์ฑ์ง์ ์ถ๊ฐํ๊ฒ ๋๋ฉด ๋ชจ๋ธ์ด ๋๋ฌด ๋ณต์กํด์ง ์ ์๋ ๋ฌธ์ ๋ฅผ ๊ฐ์ง๊ณ ์๋ค. ์ด ๊ฒฝ์ฐ ๋ช Input ๋ณ์๋ค์ ์ ๊ฑฐํ ์ ์์ด์ผ ํ๋ค. ์ด๋ ๋ชจ๋ธ์ Weight๋ฅผ 0์ ๊ฐ๊น๊ฒ ๋ณ๊ฒฝํจ์ผ๋ก์จ ํด๊ฒฐํ ์ ์๋ค. ์ ์์ ์ดํด ๋ดค๋ฏ Ridge์ Lasso์ ์ ๊ทํ ์ด๋ก ์ด ๋์ผํ๊ฒ ๋ฑ์ฅํ๋ค.
Multi Class์ ๊ฒฝ์ฐ ์ฌ๋ฌ ๊ฐ์ Binary ํด๋์ค ๋ฌธ์ ๋ก ๋ถํ ํ ์ ์๋ค. ํ์ง๋ง ์๋ฌด Class๋ ์กด์ฌํ ์ ์๋ ์์ญ๊ณผ ์ ๋งคํ ์์ญ์ด ์กด์ฌํ๋ค๋ ๋ฌธ์ ์ ์ด ๋ฑ์ฅํ๋ค.
'๐ Major Study (Bachelor) > ๐ฅ Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Classification (0) | 2022.12.06 |
---|---|
Linear Discriminant Analysis(LDA) Approach (0) | 2022.12.05 |
Stochastic Gradient Descent, Regularization(L2 Ridge, L1 Lasso) (0) | 2022.12.05 |
Linear Regression, Approach in SLE, probabilistic, Gradient Descent (0) | 2022.12.05 |
Gradient Descent Method (RSS, RMSE, Coefficient of determination) (0) | 2022.11.02 |