๐ Major Study (Bachelor)/๐ฅ Machine Learning13 Logistic Regression z๋ผ๋ ๊ฐ์ด Weight์ Input์ ๋ด์ ํ Linear Regression์ด๊ณ ์ด ๊ฐ์ด Sigmoid ํจ์์ Input ๊ฐ์ผ๋ก ๋ค์ด๊ฐ๋ค. ์ฌ์ค P๋ผ๋ ํ๋ฅ ๊ณผ P๊ฐ ์๋ 1-P์ ํ๋ฅ ์ ๋น์จ๋ก ํํ๋ ์ ์๋ ๊ฒ์ Log๋ฅผ ์ทจํ ํ P์ ๋ํด์ ํํ์ ํ๋ฉด Sigmoid ํจ์๊ฐ ๋์ค๊ฒ ๋๋ค. ์ฆ ํ๋ฅ ๊ฐ์ 0๋ถํฐ 1 ์ฌ์ด์ ๊ฐ์ผ๋ก ํํ์ ํ๊ณ Binary Decision์ ํ๊ธฐ ์ํจ์ด๋ค. Logistic Regression์ด๋ผ๋ ๊ฒ์ ๊ทธ๋ผ ์ด๋ป๊ฒ ๋ฐ์ดํฐ๋ฅผ ํ๊ธฐํ๋ ๋ฐฉ๋ฒ์ผ๊น? Linear Regression์ด๋ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ๊ฐ์ฅ ์ ํํํ๋ ์ ํ๋๋ฅผ ๊ธ๋ ๊ณผ์ ์ด๋ผ๊ณ ๋ณด๋ฉด ๋๋ค. ๊ทธ๋ผ Logistic์ ๋ป์ ์ฌ๊ธฐ์ ๋ ๋์๊ฐ Class๋ฅผ ๋ถ๋ฅํ๊ธฐ ์ํ ํ๋ฅ ๋ชจ๋ธ์ ๋ง๋ค๊ณ ์ ํ๋ ๊ฒ์ด๋ค. ๊ทธ๋์ F๋ผ๋ .. 2022. 12. 8. Classification Binary Class๋ฅผ ๊ตฌ๋ถํ ์ ์๋ ํจ์๋ฅผ ์ด๋ป๊ฒ ์ฐพ์ ์ ์์์ง ์๊ฐํด๋ณด์. ๊ฐ Input Data์ ํด๋นํ๋ Label์ด ์ฃผ์ด์ง ์ํ๋ผ๊ณ ํ์ ๋ ์์ผ๋ก ๋ค์ด์ฌ Data์ ๋ํด์ ๋ถ๋ฅํ ์ ์๋ ํจ์๋ฅผ ์ฐพ๋ ๋ฐฉ๋ฒ์ ๋ํ ์ค๋ช ์ด๋ค. ๋ง์ผ ํ์ 5๊ฐ์ ๋ฐ์ดํฐ๊ฐ ์๋ค๋ฉด ์ด ๋ถํฌ๋ฅผ Regressionํ ์ ์๋ ์ ์ ํ๋ ๊ธ๊ณ ๋ฐ๋์ Label์ ์ฃผ์ด Regression์ ํ๋ ์ ์ ํ๋ ๊ธ๊ฒ ๋๋ค. ๊ทธ๋ ๊ฒ ๋๋ฉด ์ ์ด 2๊ฐ๊ฐ ์๊ธฐ๊ฒ ๋๋๋ฐ ์ด๋ฅผ ๊ธฐ์ค์ผ๋ก Class 2๊ฐ์ ๋ํด ํ๋ณํ๋ ํจ์๋ฅผ ๋ง๋ค ์ ์๋ค. ๋ ๋ฒ์งธ๋ก ํจ์๋ฅผ ์ค์ ํ๋ ๋ฐฉ์์ผ๋ก๋ label์ด 0์ธ ๊ฒ๋ค์ ์คํ๋ ค -1๋ก ๋ฐ๊พธ์ด ๋ ํ์คํ Regression์ ๋ง๋ค์ด์ฃผ๋ ๋ฐฉ์์ด๋ค. ์ด๋ ๊ฒ ๋๋ ๊ฒฝ์ฐ๋ Binary Classification์.. 2022. 12. 6. Linear Discriminant Analysis(LDA) Approach Classification์ ๊ฒฝ์ฐ๋ฅผ ์ดํด๋ณด์. Classifier๋ฅผ ํํํ๋ ํํ ๋ฐฉ๋ฒ์ Discriminatn ํจ์๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ด๋ค. Input Data์ ๋ํด ํด๋์ค๋ฅผ ๊ฐ์ฅ ์ ์ค๋ช ํ ์ ์๋ ํจ์๋ฅผ ์ ์ํ๊ณ ์ต๋๊ฐ์ ๊ฐ์ง๋ Class๋ฅผ ์ค์ ํ๋ ๋ฐฉ์์ด๋ผ๊ณ ์ดํดํ๋ฉด ๋๋ค. ๊ทธ๋ ๋ค๋ฉด Discriminant ํจ์๋ ์ด๋ค ๊ฒ์ธ๊ฐ. Decision Boundary ๋ ํด๋์ค๋ฅผ ๊ตฌ๋ถํ ์ ์๋ ์ ์ ํ๋ ๊ธ๋ ๊ฒ์ด๋ผ๊ณ ์๊ฐํ๋ฉด ๋๋ค. ํด๋์ค 0์ ๋ํด์ ๊ฐ์ง๋ ํ๋ฅ ๊ฐ์ด ๋์ ๊ฒฝ์ฐ ํด๋์ค 0๋ก ํ๋ณ, ํด๋์ค 1์ ๋ํด์ ๊ฐ์ง๋ ํ๋ฅ ๊ฐ์ด ๋์ ๊ฒฝ์ฐ ํด๋์ค 1๋ก ํ๋ณํ๊ฒ ๋๋ค. Generative classifier ๋ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๊ธฐ ์ํ ๋ชจ๋ธ์ด๋ค. ๊ทธ๋ ๊ธฐ ๋๋ฌธ์ ๋ฐ์ดํฐ๊ฐ ์์ฑ๋ ํ๋ฅ ์ธ Joint Probab.. 2022. 12. 5. Stochastic Gradient Descent, Regularization(L2 Ridge, L1 Lasso) Gradient Descent์๋ ๋ ๊ฐ ๋ฐฉ๋ฒ์ด ์กด์ฌํ๋ค. Batch์ Online ๋ฐฉ์์ด๊ณ batch๋ ์ ์ฒด ๋ฐ์ดํฐ๋ฅผ ๊ธฐ์ค์ผ๋ก Online์ ๋ฐ์ดํฐ ํ๋์ฉ์ ๊ธฐ์ค์ผ๋ก Weight๋ฅผ ์ต์ ํํ๋ ๋ฐฉ์์ด๋ผ๊ณ ํ ์ ์๋ค. Batch ํ์ต๋ฐฉ๋ฒ์ ์ ์ฒด ํ์ต ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ์ฌ Weight๋ฅผ ํ ๋ฒ์ ์ต์ ํํ๋ ๊ฒ์ด๋ผ๊ณ ํ ์ ์๋ค. ์ ์ฒด ๋ฐ์ดํฐ๋ฅผ ์ปค๋ฒํ ์ ์์ด์ผ ํ๋ฏ๋ก ํฐ ๋ฉ๋ชจ๋ฆฌ๊ฐ ํ์ํ๋ค. ๋ํ ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ํ๊ธฐ ๋๋ฌธ์ ์ต์ ํ Route๊ฐ ๊ฝค ์์ ์ ์ผ๋ก ๋์จ๋ค๋ ๊ฒ์ด ํน์ง์ด๋ค. ๋ฐ๋ฉด Online Learning์ Training instance๋ฅผ ์ฌ์ฉํ์ฌ Weight๋ฅผ ์ต์ ํํ๋ ๋ฐฉ์์ผ๋ก ๋ฉ๋ชจ๋ฆฌ๊ฐ ํจ์ฌ ์ ๊ฒ ํ์ํ๋ค. ํ์ง๋ง ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ์ต์ ํ๊ฐ ๋๋ ๊ฒ์ด ์๋๊ธฐ ๋๋ฌธ์ ์ต์ ํ Route.. 2022. 12. 5. Linear Regression, Approach in SLE, probabilistic, Gradient Descent Supervised Learning์ด๋ ์ฃผ์ด์ง Dataset์ ํด๋นํ๋ Label ์ด ์กด์ฌํ๋ Regression์ด๋ผ๊ณ ํ๋ค. Regression์ ์ ์ ํ ์ ์ ์ฐพ๋ ๊ณผ์ ์ด๋ผ๊ณ ํ ์ ์๋ค. Regression์ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ์ ํํํ ์ ์๋ ํ๋ฆ์ ์ ํํํ๋ ๊ฒ์ด๊ณ Classification์ ๋ฐ์ดํฐ๋ฅผ ์ ๋๋ ์ ์๋ ๋ถ๋ฅ์ ์ ์ฐพ๋ ๊ฒ์ด๋ผ๊ณ ํ ์ ์๋ค. ์ฃผ์ด์ง Data์ ๋ถํฌ๋ฅผ d๋ผ๊ณ ํํํ๋ฉด d๋ Input vector๋ก ํํ๋๊ณ y๋ Label์ ํด๋นํ๋ desired output ์ด๋ผ๊ณ ํ ์ ์๋ค. ์ด๋์ ์ฃผ์ด์ง ๋ชฉํ๋ X์์ Y๋ก ๋์ํ๋ ํจ์๋ฅผ ์ฐพ๋ ๊ฒ์ด๋ค. ๊ทธ๋์ 2๊ฐ์ ๋ํ์ ์ธ Supervised Learning์ ์ดํด๋ณด๋ฉด Regression์ ์ฃผ์ด์ง Input data X๊ฐ ์ด.. 2022. 12. 5. Gradient Descent Method (RSS, RMSE, Coefficient of determination) ์์ ๊ทธ๋ํ๋ MSE์ ํด๋นํ๋ ์ค์ฐจํจ์ ๊ทธ๋ํ์ด๋ค. ์ด ์ค์ฐจ์ ํ์ฌ ์ง์ ์์์ ๋ํจ์๋ฅผ ๊ตฌํ์ฌ ๊ธฐ์ธ๊ธฐ๋ฅผ ๊ตฌํ๊ณ Iterative ํ๊ฒ Weight๋ฅผ ์ต์ ํํ๋ ๋ฐฉ์์ ๋ํ ์๊ฐํ ์๋ฃ์ด๋ค. ์ด๋์ a๋ learning rate์ด๋ค. W๊ฐ ์ ์ ๊ธฐ์ธ๊ธฐ ๋ถํธ์ ๋ฐ๋ ๋ฐฉํฅ์ผ๋ก ์ด๋ํ๋ ๊ฒ์ ํ์ธํ ์ ์๋ค. RSS์ RMSE์ ๊ฐ๋ ์ด ๋ฑ์ฅํ๋ค. RSS๋ Mean์ด ์๋ Residual๋ก ๊ฐ ์ค์ฐจ์ ์ ๊ณฑ์ ํ๊ท ๋ด๋ ๊ฒ์ด ์๋ ๊ทธ๋๋ก ๋ํ ๊ฐ์ ๋งํ๋ค. RMSE๋ MSE์ Root๋ฅผ ์์ด ํํ๋ก Original ํ ์ค์ฐจ์ ๊ฐ์ ํํํ๊ณ ์ ํ ๋ ์ฌ์ฉ๋๋ค. ์ค์ฐจ๊ฐ ์์ ๊ฐ์ ๊ฐ์ง๊ธฐ ๋๋ฌธ์ ์ ๊ณฑ์ ํด์ ํ๊ท ์ ๊ตฌํ๋๋ฐ ๋ฐ๋๋ก ๋ฃจํธ๋ฅผ ์์ฐ๊ฒ ๋๋ฉด ์๋ ์ค์ฐจ์ ํฌ๊ธฐ์ ํด๋นํ๋ ๊ฐ์ ๊ตฌํ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค. R^2์ ๊ฐ.. 2022. 11. 2. Introduction to Linear Regression. Perspective of SLE(System of Linear Equation) and Gradient Descent Supervised Learning์ label์ด ์๋ ๋ฐ์ดํฐ์ ๋ํ ํ์ต์ ์๋ฏธํ๋ค. Unsupervised Learning์ ๊ฐ์ฅ ํฐ ๋ ๊ฐ์ง Task๋ Classification๊ณผ Density Estimation์ผ๋ก ๋๋ ์ ์๋ค. ์ด๋ ๋ถํฌ์ ๋ํ ๊ฐ์ ์ ํ๋๋ ์ํ๋๋์ ๋ฐ๋ผ์๋ ์ธ๋ถํ๋์ด ๋๋๋ค. ๋ฐ๋ฉด ์ด์ ๊ฒฝ์ฐ ๋ผ๋ฒจ๋ง์ด ์กด์ฌํ๊ธฐ ๋๋ฌธ์ ๋ฐ์ดํฐ๋ฅผ ์ด๋ป๊ฒ ํด์ํ๊ณ ๋ถ๋ฅํ๋ ์ง์ ๋ํด์๋ฅผ ๋ค๋ฃฌ๋ค๊ณ ์ดํดํ๋ฉด ๋๋ค. Supervised Learning์ ๊ฒฝ์ฐ label์ด ์๋ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ์ต์ ํ๊ณ ์ต์ข ๋ชฉํ๋ ๋ฐ์ดํฐ X์์ Y๋ก ๋งตํํ ์ ์๋ ํจ์ F๋ฅผ ์ฐพ๋ ๊ฒ์ด๋ค. ์ด ์ญ์ ๋ชจ๋ธ๋ง์ ํด๋นํ๋ค๊ณ ๋ณด๋ฉด ๋๋ค. ๋ ๊ฐ์ง ํฐ Task์ ๋ํด์๋ Regression์ ๊ฒฝ์ฐ ์ฐ์์ ์ธ ๋ถํฌ์ ๋ํด์.. 2022. 11. 2. Clustering using Centroid-based approach. What is k-Means Algorithm Centroid-based Approach๋ k-Means ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ๋ค. ์ด ์ ๊ทผ ๋ฐฉ์์ ๊ธฐ์กด์ Hierachicalํ ๋ฐฉ์์ด Time๊ณผ Space๊ฐ ๋๋ฌด ๋ง์ด ์์๋๋ค๋ ์ ์ ์ฐฉ์ํ์ฌ ๋ฑ์ฅํ๋ค. ์ข ๋ ํจ์จ์ ์ธ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ Clustering ๋ฐฉ์์ด ํ์ํ๋ค. k-Means์ ์ฅ์ ์ ์ดํดํ๊ณ ๊ตฌํํ๊ธฐ ์ฝ๋ค๋ ๊ฒ์ด์ง๋ง ์ค์ง local minimun๋ง์ด ์ป์ด์ง๋ค๋ ๊ฒ์ด ๋จ์ ์ด๋ค. ๋ํ ์ด๊ธฐํํ๊ธฐ ํ๋ค๊ณ outlier์ ๋ฏผ๊ฐํ๋ค๋ ๊ฒ์ด๋ค. k-Means ์๊ณ ๋ฆฌ์ฆ์ ์์ด๋์ด์ ๋ํด ์์๋ณด์. ๊ฐ๊ฐ์ ๋ฐ์ดํฐ๋ค์ด ๊ฐ๊ฐ์ Cluster๋ก ๋ ๋ฆฝ์ ์ผ๋ก ํ ๋น์ํจ๋ค. Dissimilariy ๋ฐฉ์์ผ๋ก ๊ฑฐ๋ฆฌ ์ธก์ ๋ฐฉ์์ ์ ์ํ๊ณ , within cluster์ ํ์คํธ์ฐจ๋ฅผ ์ต์ํํ ์ ์๋ Cluster๋ก ๊ฒฐ์ ๋๋ค... 2022. 11. 1. Understanding of Unsupervised Learning (Clustering Algorithm) Agglomerative Method. ๊ธ๊น์ง ์ดํด๋ดค๋ Density Estimation์ Data์ Label์ด ์กด์ฌํ์ง ์๋ Unsupervised Learning์ ํด๋นํ๋ค. ์ด๋ ๋จธ์ ๋ฌ๋์ ์ผ๋ถ์ ํด๋นํ๋ค. ๊ทธ๋ ๋ค๋ฉด ๋ค๋ฅธ Learning์ ๋ฐฉ๋ฒ์ ์ด๋ค ๊ฒ์ด ์๋์ง ์ดํด๋ณด์. Unsupervised Learning์ ์ฃผ์ด์ง ๋ฐ์ดํฐ์ Target Output ์ด ์กด์ฌํ์ง ์์๋ค. Ground Truth ๊ฐ์ด ์๋ค๊ณ ๋ ํํํ๋ค. ์ฆ, Objective๋ ๋ฐ์ดํฐ์ Interesting Pattern์ ์ฐพ๋ ๊ฒ์ด๋ค. ์ด ์ค์ ๋ ๊ฐ์ง์ ๋ํ์ ์ธ ์ผ์ด์ค๊ฐ ์กด์ฌํ๋๋ฐ ์ฒซ์งธ๋ Density Estimation์ด๊ณ ๋์งธ๋ Clustering์ด๋ค. Density Estimation์ ์ํ ๋ฐ์ดํฐ์ ๋ถํฌ๋ฅผ ๋ชจ๋ธ๋งํ๋ ๊ฒ์ด๊ณ Clustering์ ๋น์ทํ ์.. 2022. 11. 1. Understanding about Nonparametric Density Estimation. Parzen Window and kNN Method Parametric Distribution ๋ชจ๋ธ์ ๊ฒฝ์ฐ ๋ฐ์ดํฐ์ ๋ถํฌ ์ถ์ ํ๊ธฐ๊ฐ ํธ๋ฆฌํ๋ค๋ ์ฅ์ ์ด ์๋ค. ํ์ง๋ง ํน์ ํ functional form์ ์์ด์ ์ ํ์ ์ด๊ณ ์ ํฉํ์ง ์์ ๊ฒฝ์ฐ๊ฐ ๋ฐ์ํ๋ค. ์ด์ ๋ฐํด Nonparametric ๋ฐฉ๋ฒ์ ์ ๋ฐ์ ์ธ ๋ฐ์ดํฐ ๋ถํฌ์ ๋ํด ๊ฐ์ ์ด ์๋ค๋ ๊ฒ์ด ํน์ง์ด๋ค. Nonparametric ๋ฐฉ๋ฒ์ผ๋ก๋ Histogram์ด ์๋ค. ๋น์ฐํ ํ์คํ ๊ทธ๋จ์ ๋ง์ด ๋ค์ด๋ดค์ง๋ง ์ด๊ฒ์ด ์ด๋ป๊ฒ Nonparametricํ ๋ฐฉ๋ฒ์ ์ํ๋์ง ์๊ฐํด๋ณผ ํ์๊ฐ ์๋ค. Bin์ด๋ผ๋ ๊ฐ๋ ์ด ๋ฑ์ฅํ๋๋ฐ ์ด๋ equally-spaced interval์ด๋ผ๊ณ ์๊ฐํ๋ฉด ๋๋ค. ๋์ผํ๊ฒ ๋ถ๋ฅ๋ ๊ตฌ๊ฐ ์์ ํด๋น Data๊ฐ ์ผ๋ง๋ ๋ค์ด์ค๋์ง๋ฅผ ์ธก์ ํ๋ ๋ฐฉ์์ ์ฑํํ๋ค๊ณ ์๊ฐํ๋ฉด ๋๋ค. Bin์ ๋๋น๋ฅผ Vi๋ผ๊ณ .. 2022. 11. 1. ์ด์ 1 2 ๋ค์