๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ

๐Ÿš Subject Study/๐ŸŸฅ Statistics16

ํ†ต๊ณ„ํ•™ 4์ฃผ์ฐจ ์›”์š”์ผ ์ฃผ์ˆ ์‚ฌ... assigned by lot == ์ œ๋น„ ๋ฝ‘๊ธฐ, Randomness ๊ณตํ‰ํ•˜๋‹ค. ์„ธ์ข…์ด ๋™์ „์„ ๋งŒ๋“ค๋ฉด์„œ ๋…ธ๋ฆ„์— ๋Œ€ํ•œ ๊ฑฑ์ •์„ ํ–ˆ๋‹ค. Problem of points Laplace, ์ƒ๋Œ€๋„์ˆ˜์˜ ๊ฐœ๋…์„ ๋จผ์ € ์ฐฉ์•ˆํ•ด๋ƒ„. ์ •์˜ : ๋ฐœ์ƒ ๊ฐ€๋Šฅํ•œ ๋ชจ๋“  ํ‘œ๋ณธ์˜ ์ง‘ํ•ฉ์„ ํ‘œ๋ณธ ๊ณต๊ฐ„์ด๋ผ๊ณ  ํ•œ๋‹ค. P(A) ๋ฅผ Set Function์ด๋ผ๊ณ  ํ•œ๋‹ค. ๊ณต๋ฆฌ 3๊ฐœ๊ฐ€ ๊ณต๋ฆฌ์— ํ•ด๋‹นํ•˜๊ณ , 3๋ฒˆ์งธ ์‹์ด ๊ฐ€์žฅ ์ค‘์š”ํ•˜๋‹ค. ๋ฌดํ•œ๋Œ€๋กœ ํ™•์žฅํ•ด๋„ ์•„๋ฌด๋Ÿฐ ๋ฌธ์ œ๊ฐ€ ์—†์Œ์„ ๋ฐœ๊ฒฌํ•œ ํ•™์ž๊ฐ€ Kolmogorov์ด๋‹ค. ์ˆ˜๋ฆฌ์  ํ™•๋ฅ ๊ณผ ๊ฒฝํ—˜์  ํ™•๋ฅ ์€ ๋ฌด์—‡์ด ๋‹ค๋ฅธ๊ฐ€. ์ˆœ์—ด, ์ˆœ์„œ๋ฅผ ์นด์šดํŒ… ํ•˜๋Š” ๊ฒƒ ์กฐํ•ฉ, ์ˆœ์„œ์™€ ๊ด€๊ณ„ ์—†๋Š” ๊ฒƒ. ์‹คํ—˜ ์—ฐ๊ตฌ๋Š” ์›์ธ๊ณผ ๊ฒฐ๊ณผ๋ฅผ ํ™•์‹คํ•˜๊ฒŒ ์•Œ ์ˆ˜ ์žˆ๋‹ค. ๊ด€์ธก ์—ฐ๊ตฌ๋ฅผ ํ•  ์ˆ˜ ๋ฐ–์— ์—†๋Š” ๊ฒฝ์šฐ๋Š” ํ–‰๋™๊ณผ ๊ด€๋ จ๋œ ๋ถ€๋ถ„์ด๋‹ค. association .. 2022. 3. 21.
ํ†ต๊ณ„ํ•™ 3์ฃผ์ฐจ ๋ชฉ์š”์ผ ํ•œ ๊ฐœ์˜ Observatioin์— ๋ช‡ ๊ฐœ์˜ ๋ณ€์ˆ˜๊ฐ€ ์‚ฌ์šฉ๋˜๋Š” ์ง€์— ๋”ฐ๋ผ ๋‹ค๋ฅด๋‹ค. ์‹œ์žฅ์— ๋”ฐ๋ฅธ ๋ณ€ํ™”๋ฅผ ๋ณด๋ฉด ์ด๋ณ€๋Ÿ‰ ๋ฐ์ดํ„ฐ์— ํ•ด๋‹นํ•œ๋‹ค. (์ฃผ์‹) ๊ทธ๋ž˜ํ”„๋Š” ๊ฐ๊ด€์„ฑ์— ์–ด๋ ค์›€์ด ์žˆ๋‹ค. ์‚ฐ์ˆ  ํ‰๊ท ์€ ๋ฌด๊ฒŒ ์ค‘์‹ฌ์— ํ•ด๋‹นํ•œ๋‹ค. ๋ชจ๋“  ๊ฐ’์ด ๋™์ผํ•˜๋ฉด ์ตœ๋นˆ๊ฐ’์ด ์—†๋‹ค. ๋ช…๋ชฉ ์ฒ™๋„, Norminal Scale์ด๋‹ค. ํ•ฉ๊ณ„๋ฅผ ํ‰๊ท  ๊ฐ’์œผ๋กœ ๋‚ด๋ฒ„๋ ธ๋‹ค. Star Plot์œผ๋กœ ๊ทธ๋ ค์•ผ ์ˆœ์œ„๊ฐ€ ์•„๋‹Œ ์ˆ˜์น˜์— ๋Œ€ํ•œ ๊ฐ’์„ ๋Š๋‚„ ์ˆ˜ ์žˆ๊ฒŒ ํ•  ์ˆ˜ ์žˆ๋‹ค. ํ‰๊ท ์ด๋ผ๋Š” ๊ฒƒ์€ ๋Œ€ํ‘ฏ๊ฐ’์ผ ์ˆ˜ ์žˆ์ง€๋งŒ ๊ฐ’์˜ ๋ณ€๋™์„ฑ์„ ์ž˜ ํ‘œํ˜„ํ•˜์ง€ ๋ชปํ•œ๋‹ค. Jack Welch ๋ชจ ํ‰๊ท ์„ ๋บ์„ ๋•Œ๋Š” N์œผ๋กœ ๋‚˜๋ˆˆ๋‹ค. ์‹ ๊ธฐ์–ตํ•˜๊ธฐ!! ํ•˜๋‚˜๋ผ๋„ ๊ฐ’์ด ๋‹ค๋ฅด๋ฉด ๋ถ„์‚ฐ๊ณผ ํ‘œ์ค€ํŽธ์ฐจ์˜ ๊ฐ’์ด 0๋ณด๋‹ค ์ปค์ง„๋‹ค. ์–ด๋–ป๊ฒŒ ํ•˜๋ฉด ์ˆ˜์น˜๋ฅผ ๋ถ„์„ํ•  ๊ฒƒ์ธ์ง€์— ๋Œ€ํ•œ ๊ธฐ๋ณธํ˜•์„ five numbers summary๋ผ๊ณ  ํ•œ๋‹ค. .. 2022. 3. 17.
ํ†ต๊ณ„ํ•™ 3์ฃผ์ฐจ ์›”์š”์ผ 1์žฅ Sampling ํ•˜๋Š” ๋ฐฉ๋ฒ•, 2์žฅ ์‹œ๊ฐํ™” ์ž๋ฃŒ๋Š” ์ฃผ๊ด€์ ์ด๋ผ๋Š” ๋‹จ์ ์ด ์กด์žฌ. 3์žฅ ํ‰๊ท  == ์‚ฐ์ˆ  ํ‰๊ท  : ๋‹ค ๋”ํ•ด์„œ ๊ฐœ์ˆ˜๋กœ ๋‚˜๋ˆ„๋Š” ๊ฒƒ. ๋Œ€๋ฌธ์ž X == ๋žœ๋ค(Observed variable), ์†Œ๋ฌธ์ž x == random ๊ฐ€์ค‘ ํ‰๊ท  : ์ƒ๋Œ€์  ์ค‘์š”๋„๋ฅผ ํ‘œ์‹œํ•  ์ˆ˜ ์žˆ๋‹ค. ์˜ค๋ฉ”๊ฐ€ i๊ฐ€ ์กด์žฌํ•œ๋‹ค. ์‚ฐ์ˆ  ํ‰๊ท ์˜ ๊ฒฝ์šฐ ์˜ค๋ฉ”๊ฐ€๋Š” 1/n๋กœ ๋ชจ๋‘ ๋™์ผํ•˜๊ฒŒ ๋œ๋‹ค. ํ‘œ๋ณธ ํ‰๊ท ์€ ๋Œ€ํ‘œ๊ฐ’์„ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ. Outlier๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ๋ฌด๋ฆฌ์—์„œ ๋–จ์–ด์ ธ ์žˆ๋Š” ๊ฐ’์„ ๋งํ•œ๋‹ค. ์‚ฐ์ˆ  ํ‰๊ท ์€ ๋ฌผ๋ฆฌ์ ์œผ๋กœ ์–ด๋–ค ์˜๋ฏธ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋Š”๊ฐ€? ํ™€์ˆ˜๊ฐœ์ด๋ฉด ์ค‘๊ฐ„ ๋ฒˆ์งธ์˜ ๊ฐ’์ด๊ณ  ์ง์ˆ˜ ๊ฐœ์ด๋ฉด ์ค‘๊ฐ„ ๋ฒˆ์งธ ๋‘๊ฐœ์˜ ํ‰๊ท  ๊ฐ’์ด๋‹ค. ์ด์ƒ์น˜์— ๋ฏผ๊ฐํ•˜์ง€ ์•Š๋‹ค. scale์— ๋”ฐ๋ผ์„œ ๋‹ค ๋‹ค๋ฅด๋‹ค. ํžˆ์Šคํ† ๊ทธ๋žจ์„ ๊ฐ€์ง€๊ณ  ์ตœ๋นˆ๊ฐ’์„ ์ฐพ๋Š” ๊ฒƒ์€ ์ œ์ผ ๋†’์€ ๊ฒƒ์œผ๋กœ ํ•˜๋ฉด ๋œ๋‹ค. ํ•˜์ง€.. 2022. 3. 14.
ํ†ต๊ณ„ํ•™ 2์ฃผ์ฐจ ๋ชฉ์š”์ผ Star Plot Face Chernoff ํ†ต๊ณ„ํ•™์ž, Line chart๋ฅผ ๋ณด๋ฉด ํ•˜๋‚˜๋ฅผ ๋น„๊ตํ•˜๋Š”๋ฐ, ๋‹ค๋ณ€๋Ÿ‰ ๋ฐ์ดํ„ฐ๋ฅผ ํ•˜๋‚˜์˜ ๊ทธ๋ฆผ์œผ๋กœ ๋‚˜ํƒ€๋‚ธ ํ†ต๊ณ„ํ•™์ž์ด๋‹ค. ์‚ฌ๋žŒ์˜ ์–ผ๊ตด์„ ๊ฐ€์ง€๊ณ  ๋ฐ์ดํ„ฐ๋ฅผ ํ‘œํ˜„ํ–ˆ๋‹ค. ์ค‘์š”ํ•œ ๊ฒƒ์€ 30๊ฐœ์˜ ๋ณ€์ˆ˜๋ฅผ ๋‹ค ๊ฐ€์ง€๊ณ  ๋น„๊ตํ•˜์ง€ ํž˜๋“ค๊ณ  ์–ด๋–ค ์–ผ๊ตด์˜ ๋ชจ์–‘์ธ์ง€์— ๋”ฐ๋ผ ๋น„๊ต๋ฅผ ํ•  ์ˆ˜ ์žˆ๋‹ค. ์•„์ด๋””์–ด๊ฐ€ ์ค‘์š” Sea Surface Temperature ํ•ด์ˆ˜๋ฉด์˜ ์˜จ๋„๋ฅผ ๋‚˜ํƒ€๋‚ธ๋‹ค. ์ง™์€ ์ƒ‰์˜ ๋†๋„ ์ฐจ์ด๊ฐ€ ์—†์–ด์„œ ๋ฌธ์ œ์ธ๊ฒƒ. ํˆฌํ‘œ์˜ ๊ฒฝ์šฐ ์ง€์—ญ์˜ ๋„“์ด๋กœ ๋ณด๋ฉด ๋‹ค๋ฅธ ํ›„๋ณด๊ฐ€ ๋” ๋„“์€๋ฐ ์‹ค์ œ๋กœ ํˆฌํ‘œ ์ˆ˜๋Š” ๋‹ค๋ฅธ ์‚ฌ๋žŒ์ด ๋” ๋งŽ์•˜๋‹ค. ๋ถ“๊ฝƒ ๋ฐ์ดํ„ฐ์˜ ๊ทธ๋ฆผ 3๊ฐ€์ง€ ์ข…๋ฅ˜๊ฐ€ ์žˆ๋‹ค. ๊ฐ™์€ ์ข…๋ฅ˜๋”๋ผ๋„ ๋” ์ž‘์€ ๊ฒƒ์ด ์กด์žฌํ•œ๋‹ค. ๊ทธ๋ž˜ํ”„์˜ ์˜ค๋ฅ˜์™€ ์žฌํ•ด์„๊ณผ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ๊ทธ๋ฆฌ๊ธฐ ํžˆ์Šคํ† ๊ทธ๋žจ์„ ๊ทธ๋ฆด ๋–„ ์ฃผ์˜ ์‚ฌํ•ญ ๊ฐ€๋กœ์ถ•์— ๋‚˜ํƒ€๋‚ด๋Š” ๊ฐ’๋ผ๋ฆฌ ๋ถ™์–ด์•ผ.. 2022. 3. 10.
ํ†ต๊ณ„ํ•™ 2์ฃผ์ฐจ ์›”์š”์ผ ํ†ต๊ณ„ํ•™ 2์ฃผ์ฐจ ์›”์š”์ผ ํ‘œ์™€ ๊ทธ๋ฆผ์„ ํ†ตํ•œ ์ž๋ฃŒ์˜ ์š”์•ฝ ํ™•๋ฅ  ๋ณ€์ˆ˜ = random variable, ๊ด€์ฐฐํ•˜๊ธฐ ์ „์— ๋ชจ๋ฅด๋Š” ๊ฐ’. ๋žœ๋ค ํ‘œ๋ณธ = random sample -> ๋Œ€๋ฌธ์ž Xi ๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค. ์†Œ๋ฌธ์ž x๋Š” ๊ณ ์ •๋œ ์ƒ์ˆ˜๊ฐ’์„ ์˜๋ฏธํ•œ๋‹ค. ์ผ๋ณ€๋Ÿ‰ ๋ฐ์ดํ„ฐ = ํ•˜๋‚˜ univariate data ์ด๋ณ€๋Ÿ‰ ๋ฐ์ดํ„ฐ = bivariate data ๋‹ค๋ณ€๋Ÿ‰ ๋ฐ์ดํ„ฐ = multivariate data ๋ช…๋ชฉ ์ฒ™๋„๋Š” ์งˆ์ ์ธ ๋ฐ์ดํ„ฐ์˜ ์š”์•ฝ์œผ๋กœ ์‚ฌ์šฉ๋œ๋‹ค. qualitaty data ๋ช…๋ชฉ์ด ๋ช‡ ๋ฒˆ ๋‚˜ํƒ€๋‚ฌ๋Š”๊ฐ€ ํšŸ์ˆ˜ = frequency Relative frequency ์ƒ๋Œ€๋„์ˆ˜ ๋ˆ„์  ์ƒ๋Œ€๋„์ˆ˜ = ordinal scale(๋œป์ด ๋ญ˜์ง€ ์ฐพ์•„๋ณด์ž) ์‹ฌ์Šจ์˜ ์—ญ์„ค(*******) ์ „๊ณต๋ณ„๋กœ ๋‚จ๋…€์˜ ๋น„์œจ์ด ๋น„์Šทํ•œ ์ˆ˜์ค€์„ ์œ ์ง€ํ–ˆ์ง€๋งŒ ์ „์ฒด์ ์ธ ์ธ์›์œผ๋กœ ๊ณ .. 2022. 3. 7.
ํ†ต๊ณ„ํ•™ 1์ฃผ์ฐจ ์›”์š”์ผ ์—‘์…€ ํ†ต๊ณ„ํ•™ (ํ•œ๊ธ€ํŒ) ๊ต์žฌ๊ฐ€ ์žˆ๋‹ค. - ๊ฑฐ์ง€๊ฐ™์ด ์ผ๋‹ค.(์„œ์ˆ ์ด ๋งŽ์ด ์ค„์–ด๋“ค์—ˆ๋‹ค) ํฐ ๋…ธ์ด๋งŒ ์–˜๊ธฐ ํ†ต๊ณ„ํ•™ - ๊ท€๋‚ฉ์ (์‹ ์•ฝ), ์—๋Ÿฌ๋ฅผ ์ธ์ •ํ•œ ํ•™๋ฌธ. ์ž์‹ ์„ ํ–ฅํ•ด์„œ๋Š” ์—„๊ฒฉํ•ด์•ผ ํ•œ๋‹ค. ์ˆ˜ํ•™ - ์—ฐ์—ญ์ (๊ตฌ์•ฝ) ํ˜ธ๊ธฐ์‹ฌ๊ณผ ์ฐฝ์˜์„ฑ์„ ๋ฐ”ํƒ•์œผ๋กœ ์ „๋ฌธ์  ๊ธฐ์ˆ ๋กœ ์‹คํ˜„ํ•ด๋ผ. (ํ†ต๊ณ„ํ•™์€ ํ•„์ˆ˜์ ์ธ ์š”์†Œ) 1949๋…„ AI์˜ ์–ธ์–ด ์ •์˜๋จ. ํ•„์š”ํ•œ ํ•˜๋“œ์›จ์–ด๋Š” ์–ด๋Š์ •๋„ ๋‹ค ๊ฐ–์ถ”์–ด์ ธ ์žˆ๋‹ค. ์„œ์ˆ ์„ ์ž˜ํ•ด์•ผ ํ•œ๋‹ค. ๋ถˆํ™•์‹ค์„ฑ์„ ๊ณผํ•™์ ์œผ๋กœ ์ฆ๋ช…ํ•˜๋Š” ๊ฒƒ. ์‹ค์—…๋ฅ , ํ›„๋ณด๋ณ„ ์ง€์ง€์œจ - ์ง„๋‹จ ๊ธฐ๋Šฅ์„ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค. Status, ์•„๋ฆฌ์Šคํ† ํ…”๋ ˆ์Šค ์‹œ์ ˆ ์ค‘์š”ํ•œ ์ •๋ณด์˜€์Œ. ๋ณ‘๋ ฅ์ด ์–ผ๋งˆ๊ณ , ์‹๋Ÿ‰์ด ์–ผ๋งˆ๋‚˜ ์žˆ๊ณ ... ๋“ฑ๋“ฑ Statistic ํ†ต๊ณ„ํ•™์˜ ์ •์˜ x ํ†ต๊ณ„ํ•™ - ๊ธฐ์ˆ  ํ†ต๊ณ„ํ•™ (Descriptive Statics) ๊ณ ๋“ฑํ•™๊ต์—์„œ ๋ฐฐ์šด ๋‚ด์šฉ. ํ™•๋ฅ ์„ ์ œ๋Œ€๋กœ ํ•ด์„ํ•˜.. 2022. 2. 28.