๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿš— Major Study (Bachelor)/๐ŸŸฅ Machine Learning

Classification

by UKHYUN22 2022. 12. 6.
728x90

Binary Class๋ฅผ ๊ตฌ๋ถ„ํ•  ์ˆ˜ ์žˆ๋Š” ํ•จ์ˆ˜๋ฅผ ์–ด๋–ป๊ฒŒ ์ฐพ์„ ์ˆ˜ ์žˆ์„์ง€ ์ƒ๊ฐํ•ด๋ณด์ž. ๊ฐ Input Data์— ํ•ด๋‹นํ•˜๋Š” Label์ด ์ฃผ์–ด์ง„ ์ƒํƒœ๋ผ๊ณ  ํ–ˆ์„ ๋•Œ ์•ž์œผ๋กœ ๋“ค์–ด์˜ฌ Data์— ๋Œ€ํ•ด์„œ ๋ถ„๋ฅ˜ํ•  ์ˆ˜ ์žˆ๋Š” ํ•จ์ˆ˜๋ฅผ ์ฐพ๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•œ ์„ค๋ช…์ด๋‹ค. ๋งŒ์ผ ํ‘œ์— 5๊ฐœ์˜ ๋ฐ์ดํ„ฐ๊ฐ€ ์žˆ๋‹ค๋ฉด ์ด ๋ถ„ํฌ๋ฅผ Regressionํ•  ์ˆ˜ ์žˆ๋Š” ์„ ์„ ํ•˜๋‚˜ ๊ธ‹๊ณ  ๋ฐ˜๋Œ€์˜ Label์„ ์ฃผ์–ด Regression์„ ํ•˜๋Š” ์„ ์„ ํ•˜๋‚˜ ๊ธ‹๊ฒŒ ๋œ๋‹ค. ๊ทธ๋ ‡๊ฒŒ ๋˜๋ฉด ์„ ์ด 2๊ฐœ๊ฐ€ ์ƒ๊ธฐ๊ฒŒ ๋˜๋Š”๋ฐ ์ด๋ฅผ ๊ธฐ์ค€์œผ๋กœ Class 2๊ฐœ์— ๋Œ€ํ•ด ํŒ๋ณ„ํ•˜๋Š” ํ•จ์ˆ˜๋ฅผ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค.

 

๋‘ ๋ฒˆ์งธ๋กœ ํ•จ์ˆ˜๋ฅผ ์„ค์ •ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ๋Š” label์ด 0์ธ ๊ฒƒ๋“ค์„ ์˜คํžˆ๋ ค -1๋กœ ๋ฐ”๊พธ์–ด ๋” ํ™•์‹คํ•œ Regression์„ ๋งŒ๋“ค์–ด์ฃผ๋Š” ๋ฐฉ์‹์ด๋‹ค. ์ด๋ ‡๊ฒŒ ๋˜๋Š” ๊ฒฝ์šฐ๋„ Binary Classification์˜ ์—ญํ• ์„ ์ถฉ๋ถ„ํžˆ ํ•  ์ˆ˜ ์žˆ๋‹ค.

 

ํ•œ๊ณ„์ ์œผ๋กœ 2๊ฐ€์ง€๊ฐ€ ์กด์žฌํ•œ๋‹ค. ํ™•๋ฅ ์ ์œผ๋กœ Linear Regression์€ ๊ฐ€์šฐ์‹œ์•ˆ ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅด์ง€๋งŒ ์šฐ๋ฆฌ๋Š” ์˜ค์ง 2๊ฐœ์˜ ํƒ€๊ฒŸ Value๊ฐ€ ์žˆ๋‹ค๋Š” ๊ฒƒ์ด๊ณ  ๋‘ ๋ฒˆ์งธ๋กœ๋Š” ์‚ฌ์‹ค ์šฐ๋ฆฌ๋Š” ๋ชจ๋ธ์„ ํ™•๋ฅ ์ ์œผ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ์–ด์•ผ ํ•˜๋Š”๋ฐ ์ด๊ฒƒ์ด ๊ฐ€๋Šฅํ•œ๊ฐ€์— ๋Œ€ํ•œ ํ•œ๊ณ„์ ๋„ ์กด์žฌํ•œ๋‹ค.

 

๊ทธ๋ž˜์„œ ๋“ฑ์žฅํ•œ ๊ฒƒ์ด Logistic Regression์ด๋‹ค. ์ง€๊ธˆ๊นŒ์ง€ ์ฃผ์–ด์ง„ ๋ผ๋ฒจ ๋ฐ์ดํ„ฐ๋ฅผ ์—ญ์œผ๋กœ ๋งŒ๋“ค๊ฑฐ๋‚˜ ์Œ์ˆ˜๋ฅผ ์ทจํ•ด์„œ regression์„ ํ•˜๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ์ ‘๊ทผ์„ ํ–ˆ์—ˆ๋‹ค๋ฉด ํ•จ์ˆ˜๋ฅผ ๋Œ€์ž…ํ•˜์—ฌ ํด๋ž˜์Šค๋ฅผ ๋ถ„๋ฅ˜ํ•˜์ž๋Š” ๊ฒƒ์ด๋‹ค. Sigmoid๋ผ๋Š” ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜๊ฒŒ ๋  ๊ฒƒ์ธ๋ฐ ์ด๋Š” 0๊ณผ 1 ์‚ฌ์ด์˜ ๋ฒ”์œ„๋ฅผ ๊ฐ€์ง€๋Š” ํ™•๋ฅ ๊ฐ’์œผ๋กœ ๋ชจ๋ธ์„ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค. Linear Regression์„ ํ•˜๊ฒŒ ๋˜๋ฉด ์ง์„ ์œผ๋กœ ํ‘œํ˜„๋˜์–ด 0๋ณด๋‹ค ์•„๋ž˜, 1๋ณด๋‹ค ํฐ ์ง€์ ์ด ์ƒ๊ธฐ๋Š”๋ฐ ์ด ๋ถ€๋ถ„์ด ์“ธ๋ชจ ์—†๋Š” ๋ถ€๋ถ„์ด๋ผ๋Š” ์ ์— ์ฐฉ์•ˆํ•˜์—ฌ 0๊ณผ 1์„ ๋ฒ—์–ด๋‚˜์ง€ ์•Š๋Š” ๋ฒ”์œ„์—์„œ ํ™•๋ฅ ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์„ ๋งŒ๋“ค๊ณ ์ž ํ–ˆ๋˜ ๊ฒƒ์ด๋‹ค. 

 

Logistic ํ•จ์ˆ˜๋ฅผ Sigmoid ํ•จ์ˆ˜๋ผ๊ณ  ์ด์ œ ๋ถ€๋ฅธ๋‹ค. Sigmoid ํ•จ์ˆ˜์‹์ด ๋„์ถœ๋˜๋Š” ๊ณผ์ •์„ ์‚ดํŽด๋ณด๋ฉด ์ดˆ๊ธฐ์— ํ™•๋ฅ  ๊ฐ’์œผ๋กœ ํ‘œํ˜„ํ•˜๋Š” ๊ฒƒ์€ p์™€ (1-p)์˜ ๋น„์œจ๋กœ ํ‘œํ˜„์ด ๋˜๊ณ  ์ด๊ฒƒ์˜ Log ํ•จ์ˆ˜๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ํ•œ๋‹ค. ํ•ด๋‹น log ํ•จ์ˆ˜๋ฅผ Linear regression์œผ๋กœ ํ‘œํ˜„ํ•˜๊ณ ์ž ๋ฐฉ์ •์‹์„ ์„ธ์šฐ๊ฒŒ ๋˜๋ฉด ๊ฒฐ๊ตญ P์— ๋Œ€ํ•ด์„œ ํ‘œํ˜„์„ ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๋Š” ๊ฒฐ๊ตญ X ๋ฐ์ดํ„ฐ๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ Y๊ฐ€ 1์ผ ํ™•๋ฅ ์„ ํ‘œํ˜„ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ํ•ด์„๋  ์ˆ˜ ์žˆ๋‹ค.

 

Linear regression์— ๋Œ€ํ•œ Logistic function์„ ๋Œ€์ž…์„ ํ•˜๋ฉด 0๊ณผ 1์‚ฌ์ด์˜ ํ™•๋ฅ ๊ฐ’์œผ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๊ณ  Threshold ๊ฐ’์— ๋”ฐ๋ผ ํด๋ž˜์Šค๋ฅผ ๋ถ„๋ฅ˜ํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์ด ์ƒ์„ฑ๋œ๋‹ค.