๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿš— Major Study (Bachelor)/๐ŸŸฅ Machine Learning

Gradient Descent Method (RSS, RMSE, Coefficient of determination)

by UKHYUN22 2022. 11. 2.
728x90

์œ„์˜ ๊ทธ๋ž˜ํ”„๋Š” MSE์— ํ•ด๋‹นํ•˜๋Š” ์˜ค์ฐจํ•จ์ˆ˜ ๊ทธ๋ž˜ํ”„์ด๋‹ค. ์ด ์˜ค์ฐจ์˜ ํ˜„์žฌ ์ง€์ ์—์„œ์˜ ๋„ํ•จ์ˆ˜๋ฅผ ๊ตฌํ•˜์—ฌ ๊ธฐ์šธ๊ธฐ๋ฅผ ๊ตฌํ•˜๊ณ  Iterative ํ•˜๊ฒŒ Weight๋ฅผ ์ตœ์‹ ํ™”ํ•˜๋Š” ๋ฐฉ์‹์— ๋Œ€ํ•œ ์‹œ๊ฐํ™” ์ž๋ฃŒ์ด๋‹ค. ์ด๋•Œ์˜ a๋Š” learning rate์ด๋‹ค.

 

W๊ฐ€ ์ ์  ๊ธฐ์šธ๊ธฐ ๋ถ€ํ˜ธ์˜ ๋ฐ˜๋Œ€ ๋ฐฉํ–ฅ์œผ๋กœ ์ด๋™ํ•˜๋Š” ๊ฒƒ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.

 

 

RSS์™€ RMSE์˜ ๊ฐœ๋…์ด ๋“ฑ์žฅํ•œ๋‹ค. RSS๋Š” Mean์ด ์•„๋‹Œ Residual๋กœ ๊ฐ ์˜ค์ฐจ์˜ ์ œ๊ณฑ์„ ํ‰๊ท ๋‚ด๋Š” ๊ฒƒ์ด ์•„๋‹Œ ๊ทธ๋Œ€๋กœ ๋”ํ•œ ๊ฐ’์„ ๋งํ•œ๋‹ค. RMSE๋Š” MSE์— Root๋ฅผ ์”Œ์šด ํ˜•ํƒœ๋กœ Original ํ•œ ์˜ค์ฐจ์˜ ๊ฐ’์„ ํ‘œํ˜„ํ•˜๊ณ ์ž ํ•  ๋•Œ ์‚ฌ์šฉ๋œ๋‹ค. ์˜ค์ฐจ๊ฐ€ ์Œ์˜ ๊ฐ’์„ ๊ฐ€์ง€๊ธฐ ๋•Œ๋ฌธ์— ์ œ๊ณฑ์„ ํ•ด์„œ ํ‰๊ท ์„ ๊ตฌํ–ˆ๋Š”๋ฐ ๋ฐ˜๋Œ€๋กœ ๋ฃจํŠธ๋ฅผ ์”Œ์šฐ๊ฒŒ ๋˜๋ฉด ์›๋ž˜ ์˜ค์ฐจ์˜ ํฌ๊ธฐ์— ํ•ด๋‹นํ•˜๋Š” ๊ฐ’์„ ๊ตฌํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. R^2์˜ ๊ฐœ๋…๋„ ๋“ฑ์žฅํ•˜๋Š”๋ฐ ์ด๋Š” Label ๋ฐ์ดํ„ฐ์˜ ๋ถ„์‚ฐ๊ณผ ์˜ค์ฐจ์˜์˜ ํ‰๊ท ์„ ๋น„๊ตํ•˜๋Š” ๊ฒƒ์ด๋ผ๊ณ  ๋ณด๋ฉด ๋œ๋‹ค. 1์—์„œ RSS/TSS์˜ ๊ฐ’์„ ๋นผ๊ธฐ ๋•Œ๋ฌธ์— ๋ฒ”์œ„๋Š” 0์—์„œ 1 ์‚ฌ์ด์˜ ๊ฐ’์„ ๊ฐ€์ง€๊ณ , ์˜ค์ฐจ์™€ ๋ฐ˜๋Œ€๋กœ ๊ฐ’์ด 1์— ๊ฐ€๊นŒ์šธ ์ˆ˜๋ก (์ปค์งˆ์ˆ˜๋ก) ๋” ์ข‹์€ ๋ชจ๋ธ์ž„์„ ๊ธฐ์–ตํ•˜์ž. ์˜ค๋ฅธ์ชฝ ๊ทธ๋ž˜ํ”„์—์„œ ์œ„์˜ ๊ทธ๋ž˜ํ”„๋Š” R2๊ฐ€ 0.5๋ณด๋‹ค ์ž‘์€ ๊ฐ’์„ ๊ฐ€์งˆ ๋•Œ, R2๊ฐ€ 0.5๋ณด๋‹ค ํฐ ๊ฐ’์„ ๊ฐ€์งˆ ๋•Œ Diagonal(Perfect Prediction)์— ์–ผ๋งˆ๋‚˜ ๋” ๊ฐ€๊นŒ์šด์ง€ ๋ˆˆ์œผ๋กœ ํ™•์ธํ•  ์ˆ˜ ์žˆ๋‹ค.