๐ Subject Study/๐ฅ Statistics16 ํต๊ณํ 4์ฃผ์ฐจ ์์์ผ ์ฃผ์ ์ฌ... assigned by lot == ์ ๋น ๋ฝ๊ธฐ, Randomness ๊ณตํํ๋ค. ์ธ์ข ์ด ๋์ ์ ๋ง๋ค๋ฉด์ ๋ ธ๋ฆ์ ๋ํ ๊ฑฑ์ ์ ํ๋ค. Problem of points Laplace, ์๋๋์์ ๊ฐ๋ ์ ๋จผ์ ์ฐฉ์ํด๋. ์ ์ : ๋ฐ์ ๊ฐ๋ฅํ ๋ชจ๋ ํ๋ณธ์ ์งํฉ์ ํ๋ณธ ๊ณต๊ฐ์ด๋ผ๊ณ ํ๋ค. P(A) ๋ฅผ Set Function์ด๋ผ๊ณ ํ๋ค. ๊ณต๋ฆฌ 3๊ฐ๊ฐ ๊ณต๋ฆฌ์ ํด๋นํ๊ณ , 3๋ฒ์งธ ์์ด ๊ฐ์ฅ ์ค์ํ๋ค. ๋ฌดํ๋๋ก ํ์ฅํด๋ ์๋ฌด๋ฐ ๋ฌธ์ ๊ฐ ์์์ ๋ฐ๊ฒฌํ ํ์๊ฐ Kolmogorov์ด๋ค. ์๋ฆฌ์ ํ๋ฅ ๊ณผ ๊ฒฝํ์ ํ๋ฅ ์ ๋ฌด์์ด ๋ค๋ฅธ๊ฐ. ์์ด, ์์๋ฅผ ์นด์ดํ ํ๋ ๊ฒ ์กฐํฉ, ์์์ ๊ด๊ณ ์๋ ๊ฒ. ์คํ ์ฐ๊ตฌ๋ ์์ธ๊ณผ ๊ฒฐ๊ณผ๋ฅผ ํ์คํ๊ฒ ์ ์ ์๋ค. ๊ด์ธก ์ฐ๊ตฌ๋ฅผ ํ ์ ๋ฐ์ ์๋ ๊ฒฝ์ฐ๋ ํ๋๊ณผ ๊ด๋ จ๋ ๋ถ๋ถ์ด๋ค. association .. 2022. 3. 21. ํต๊ณํ 3์ฃผ์ฐจ ๋ชฉ์์ผ ํ ๊ฐ์ Observatioin์ ๋ช ๊ฐ์ ๋ณ์๊ฐ ์ฌ์ฉ๋๋ ์ง์ ๋ฐ๋ผ ๋ค๋ฅด๋ค. ์์ฅ์ ๋ฐ๋ฅธ ๋ณํ๋ฅผ ๋ณด๋ฉด ์ด๋ณ๋ ๋ฐ์ดํฐ์ ํด๋นํ๋ค. (์ฃผ์) ๊ทธ๋ํ๋ ๊ฐ๊ด์ฑ์ ์ด๋ ค์์ด ์๋ค. ์ฐ์ ํ๊ท ์ ๋ฌด๊ฒ ์ค์ฌ์ ํด๋นํ๋ค. ๋ชจ๋ ๊ฐ์ด ๋์ผํ๋ฉด ์ต๋น๊ฐ์ด ์๋ค. ๋ช ๋ชฉ ์ฒ๋, Norminal Scale์ด๋ค. ํฉ๊ณ๋ฅผ ํ๊ท ๊ฐ์ผ๋ก ๋ด๋ฒ๋ ธ๋ค. Star Plot์ผ๋ก ๊ทธ๋ ค์ผ ์์๊ฐ ์๋ ์์น์ ๋ํ ๊ฐ์ ๋๋ ์ ์๊ฒ ํ ์ ์๋ค. ํ๊ท ์ด๋ผ๋ ๊ฒ์ ๋ํฏ๊ฐ์ผ ์ ์์ง๋ง ๊ฐ์ ๋ณ๋์ฑ์ ์ ํํํ์ง ๋ชปํ๋ค. Jack Welch ๋ชจ ํ๊ท ์ ๋บ์ ๋๋ N์ผ๋ก ๋๋๋ค. ์ ๊ธฐ์ตํ๊ธฐ!! ํ๋๋ผ๋ ๊ฐ์ด ๋ค๋ฅด๋ฉด ๋ถ์ฐ๊ณผ ํ์คํธ์ฐจ์ ๊ฐ์ด 0๋ณด๋ค ์ปค์ง๋ค. ์ด๋ป๊ฒ ํ๋ฉด ์์น๋ฅผ ๋ถ์ํ ๊ฒ์ธ์ง์ ๋ํ ๊ธฐ๋ณธํ์ five numbers summary๋ผ๊ณ ํ๋ค. .. 2022. 3. 17. ํต๊ณํ 3์ฃผ์ฐจ ์์์ผ 1์ฅ Sampling ํ๋ ๋ฐฉ๋ฒ, 2์ฅ ์๊ฐํ ์๋ฃ๋ ์ฃผ๊ด์ ์ด๋ผ๋ ๋จ์ ์ด ์กด์ฌ. 3์ฅ ํ๊ท == ์ฐ์ ํ๊ท : ๋ค ๋ํด์ ๊ฐ์๋ก ๋๋๋ ๊ฒ. ๋๋ฌธ์ X == ๋๋ค(Observed variable), ์๋ฌธ์ x == random ๊ฐ์ค ํ๊ท : ์๋์ ์ค์๋๋ฅผ ํ์ํ ์ ์๋ค. ์ค๋ฉ๊ฐ i๊ฐ ์กด์ฌํ๋ค. ์ฐ์ ํ๊ท ์ ๊ฒฝ์ฐ ์ค๋ฉ๊ฐ๋ 1/n๋ก ๋ชจ๋ ๋์ผํ๊ฒ ๋๋ค. ํ๋ณธ ํ๊ท ์ ๋ํ๊ฐ์ ์ฌ์ฉํ๋ ๊ฒ. Outlier๋ ์ผ๋ฐ์ ์ผ๋ก ๋ฌด๋ฆฌ์์ ๋จ์ด์ ธ ์๋ ๊ฐ์ ๋งํ๋ค. ์ฐ์ ํ๊ท ์ ๋ฌผ๋ฆฌ์ ์ผ๋ก ์ด๋ค ์๋ฏธ๋ฅผ ๊ฐ์ง๊ณ ์๋๊ฐ? ํ์๊ฐ์ด๋ฉด ์ค๊ฐ ๋ฒ์งธ์ ๊ฐ์ด๊ณ ์ง์ ๊ฐ์ด๋ฉด ์ค๊ฐ ๋ฒ์งธ ๋๊ฐ์ ํ๊ท ๊ฐ์ด๋ค. ์ด์์น์ ๋ฏผ๊ฐํ์ง ์๋ค. scale์ ๋ฐ๋ผ์ ๋ค ๋ค๋ฅด๋ค. ํ์คํ ๊ทธ๋จ์ ๊ฐ์ง๊ณ ์ต๋น๊ฐ์ ์ฐพ๋ ๊ฒ์ ์ ์ผ ๋์ ๊ฒ์ผ๋ก ํ๋ฉด ๋๋ค. ํ์ง.. 2022. 3. 14. ํต๊ณํ 2์ฃผ์ฐจ ๋ชฉ์์ผ Star Plot Face Chernoff ํต๊ณํ์, Line chart๋ฅผ ๋ณด๋ฉด ํ๋๋ฅผ ๋น๊ตํ๋๋ฐ, ๋ค๋ณ๋ ๋ฐ์ดํฐ๋ฅผ ํ๋์ ๊ทธ๋ฆผ์ผ๋ก ๋ํ๋ธ ํต๊ณํ์์ด๋ค. ์ฌ๋์ ์ผ๊ตด์ ๊ฐ์ง๊ณ ๋ฐ์ดํฐ๋ฅผ ํํํ๋ค. ์ค์ํ ๊ฒ์ 30๊ฐ์ ๋ณ์๋ฅผ ๋ค ๊ฐ์ง๊ณ ๋น๊ตํ์ง ํ๋ค๊ณ ์ด๋ค ์ผ๊ตด์ ๋ชจ์์ธ์ง์ ๋ฐ๋ผ ๋น๊ต๋ฅผ ํ ์ ์๋ค. ์์ด๋์ด๊ฐ ์ค์ Sea Surface Temperature ํด์๋ฉด์ ์จ๋๋ฅผ ๋ํ๋ธ๋ค. ์ง์ ์์ ๋๋ ์ฐจ์ด๊ฐ ์์ด์ ๋ฌธ์ ์ธ๊ฒ. ํฌํ์ ๊ฒฝ์ฐ ์ง์ญ์ ๋์ด๋ก ๋ณด๋ฉด ๋ค๋ฅธ ํ๋ณด๊ฐ ๋ ๋์๋ฐ ์ค์ ๋ก ํฌํ ์๋ ๋ค๋ฅธ ์ฌ๋์ด ๋ ๋ง์๋ค. ๋ถ๊ฝ ๋ฐ์ดํฐ์ ๊ทธ๋ฆผ 3๊ฐ์ง ์ข ๋ฅ๊ฐ ์๋ค. ๊ฐ์ ์ข ๋ฅ๋๋ผ๋ ๋ ์์ ๊ฒ์ด ์กด์ฌํ๋ค. ๊ทธ๋ํ์ ์ค๋ฅ์ ์ฌํด์๊ณผ ์ฌ๋ฐ๋ฅด๊ฒ ๊ทธ๋ฆฌ๊ธฐ ํ์คํ ๊ทธ๋จ์ ๊ทธ๋ฆด ๋ ์ฃผ์ ์ฌํญ ๊ฐ๋ก์ถ์ ๋ํ๋ด๋ ๊ฐ๋ผ๋ฆฌ ๋ถ์ด์ผ.. 2022. 3. 10. ํต๊ณํ 2์ฃผ์ฐจ ์์์ผ ํต๊ณํ 2์ฃผ์ฐจ ์์์ผ ํ์ ๊ทธ๋ฆผ์ ํตํ ์๋ฃ์ ์์ฝ ํ๋ฅ ๋ณ์ = random variable, ๊ด์ฐฐํ๊ธฐ ์ ์ ๋ชจ๋ฅด๋ ๊ฐ. ๋๋ค ํ๋ณธ = random sample -> ๋๋ฌธ์ Xi ๋ฅผ ์ฌ์ฉํ๋ค. ์๋ฌธ์ x๋ ๊ณ ์ ๋ ์์๊ฐ์ ์๋ฏธํ๋ค. ์ผ๋ณ๋ ๋ฐ์ดํฐ = ํ๋ univariate data ์ด๋ณ๋ ๋ฐ์ดํฐ = bivariate data ๋ค๋ณ๋ ๋ฐ์ดํฐ = multivariate data ๋ช ๋ชฉ ์ฒ๋๋ ์ง์ ์ธ ๋ฐ์ดํฐ์ ์์ฝ์ผ๋ก ์ฌ์ฉ๋๋ค. qualitaty data ๋ช ๋ชฉ์ด ๋ช ๋ฒ ๋ํ๋ฌ๋๊ฐ ํ์ = frequency Relative frequency ์๋๋์ ๋์ ์๋๋์ = ordinal scale(๋ป์ด ๋ญ์ง ์ฐพ์๋ณด์) ์ฌ์จ์ ์ญ์ค(*******) ์ ๊ณต๋ณ๋ก ๋จ๋ ์ ๋น์จ์ด ๋น์ทํ ์์ค์ ์ ์งํ์ง๋ง ์ ์ฒด์ ์ธ ์ธ์์ผ๋ก ๊ณ .. 2022. 3. 7. ํต๊ณํ 1์ฃผ์ฐจ ์์์ผ ์์ ํต๊ณํ (ํ๊ธํ) ๊ต์ฌ๊ฐ ์๋ค. - ๊ฑฐ์ง๊ฐ์ด ์ผ๋ค.(์์ ์ด ๋ง์ด ์ค์ด๋ค์๋ค) ํฐ ๋ ธ์ด๋ง ์๊ธฐ ํต๊ณํ - ๊ท๋ฉ์ (์ ์ฝ), ์๋ฌ๋ฅผ ์ธ์ ํ ํ๋ฌธ. ์์ ์ ํฅํด์๋ ์๊ฒฉํด์ผ ํ๋ค. ์ํ - ์ฐ์ญ์ (๊ตฌ์ฝ) ํธ๊ธฐ์ฌ๊ณผ ์ฐฝ์์ฑ์ ๋ฐํ์ผ๋ก ์ ๋ฌธ์ ๊ธฐ์ ๋ก ์คํํด๋ผ. (ํต๊ณํ์ ํ์์ ์ธ ์์) 1949๋ AI์ ์ธ์ด ์ ์๋จ. ํ์ํ ํ๋์จ์ด๋ ์ด๋์ ๋ ๋ค ๊ฐ์ถ์ด์ ธ ์๋ค. ์์ ์ ์ํด์ผ ํ๋ค. ๋ถํ์ค์ฑ์ ๊ณผํ์ ์ผ๋ก ์ฆ๋ช ํ๋ ๊ฒ. ์ค์ ๋ฅ , ํ๋ณด๋ณ ์ง์ง์จ - ์ง๋จ ๊ธฐ๋ฅ์ ๊ฐ์ง๊ณ ์๋ค. Status, ์๋ฆฌ์คํ ํ ๋ ์ค ์์ ์ค์ํ ์ ๋ณด์์. ๋ณ๋ ฅ์ด ์ผ๋ง๊ณ , ์๋์ด ์ผ๋ง๋ ์๊ณ ... ๋ฑ๋ฑ Statistic ํต๊ณํ์ ์ ์ x ํต๊ณํ - ๊ธฐ์ ํต๊ณํ (Descriptive Statics) ๊ณ ๋ฑํ๊ต์์ ๋ฐฐ์ด ๋ด์ฉ. ํ๋ฅ ์ ์ ๋๋ก ํด์ํ.. 2022. 2. 28. ์ด์ 1 2 ๋ค์