๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿš Subject Study/๐ŸŸฅ Statistics

ํ†ต๊ณ„ํ•™ 7์ฃผ์ฐจ ์›”์š”์ผ

by UKHYUN22 2022. 4. 11.
728x90

8์ฃผ์ฐจ ์›”์š”์ผ ์ €๋… 7์‹œ ์˜ค์„ 405ํ˜ธ์—์„œ ์ค‘๊ฐ„๊ณ ์‚ฌ ์‹œํ—˜

 

๋ชจ์ง‘๋‹จ ๋ถ„ํฌ

sampling distribution์€ ํ‘œ๋ณธ ๋ถ„ํฌ๋ฅผ ์˜๋ฏธํ•œ๋‹ค.

๋ชจ์ง‘๋‹จ ๋ถ„ํฌ๋Š” ์šฐ๋ฆฌ๊ฐ€ ์•Œ๊ณ  ์žˆ๋‹ค. 5๋ช…์— ๋Œ€ํ•ด์„œ ๋ชจ์ง‘๋‹จ์œผ๋กœ ํ•˜์ž๊ณ  ์„ค์ •์„ ํ•œ ๊ฒƒ. 

 

๋ชจ์ง‘๋‹จ์˜ ํŠน์„ฑ์„ ๋‚˜ํƒ€๋‚ด๋Š” ๊ฒƒ์„ ๋ชจ์ˆ˜๋ผ๊ณ  ํ•œ๋‹ค. ๋ชจ์ง‘๋‹จ์— ๊ด€์‹ฌ์žˆ๋Š”, ๋ชจ์ง‘๋‹จ์˜ ํŠน์„ฑ์„ ์˜๋ฏธํ•œ๋‹ค.

๋žœ๋ค Sample, Random์— ๋Œ€ํ•œ ์ •์˜?? ์‚ฌ์ „์— ๋ชจ๋ฅด๋Š” ๊ฒƒ์„ Randomness๋ผ๊ณ  ํ•œ๋‹ค. ํ‘œ๋ณธ์„ ์–ด๋–ป๊ฒŒ ๋ฝ‘์„์ง€ ๋ชจ๋ฅด๋Š” ๊ฒƒ์„ Randomness๋ผ๊ณ  ํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ๋ชจ์ง‘๋‹จ ์ „์ฒด๋ฅผ ์กฐ์‚ฌํ•˜๋Š” ๊ฒƒ์— ์‹œ๊ฐ„๊ณผ ๊ฒฝ๋น„๊ฐ€ ๋„ˆ๋ฌด ๋งŽ์ด ๋“ ๋‹ค. ํ‘œ๋ณธ์กฐ์‚ฌ ๊ฐ’๋„ ๋ชจ์ˆ˜์™€ ์ •๋ง ๋น„์Šทํ•˜๊ฒŒ ๋‚˜์˜จ๋‹ค. ๋ชจ์ˆ˜์™€ ํฐ ์ฐจ์ด๊ฐ€ ์—†๋‹ค๋Š” ๊ฒƒ๋„ ์ค‘์š”ํ•œ ํŠน์ง• ์ค‘์˜ ํ•˜๋‚˜์ด๋‹ค. 

์ธ์› ์ˆ˜๊ฐ€ ๋” ๋งŽ์€ ๋Œ€ํ†ต๋ น ์„ ๊ฑฐ๊ฐ€ ๊ตญํšŒ์˜์› ์„ ๊ฑฐ๋ณด๋‹ค ์˜ˆ์ธกํ•˜๊ธฐ ์‰ฌ์šด ์ด์œ ๋Š” "์˜ค์ฐจ"์— ๋‹ฌ๋ ค์žˆ๋‹ค. ์˜ค์ฐจ ์ƒ์‡„

 

์ถ”์ •๋Ÿ‰์€ ํ†ต๊ณ„๋Ÿ‰ ๊ฐ€์šด๋ฐ์—์„œ ๋ชจ์ˆ˜๋ฅผ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์„ ์˜๋ฏธํ•œ๋‹ค ๋ชจ์ง‘๋‹จ์˜ ํŠน์„ฑ์„ ์•Œ์•„๋‚ด๋Š” ๊ฒƒ์„ ์ถ”์ •๋Ÿ‰์ด๋ผ๊ณ  ํ•œ๋‹ค. ํ†ต๊ณ„๋Ÿ‰์˜ ๊ฒฝ์šฐ ๋žœ๋ค ํ‘œ๋ณธ์œผ๋กœ ๋ถ€ํ„ฐ ๊ณ„์‚ฐ๋˜๋Š” ๊ฒƒ์ด๊ณ  ์ถ”์ •๋Ÿ‰์€ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋Š” ์˜๋ฏธ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค. ํ†ต๊ณ„๋Ÿ‰์€ ๋žœ๋ค์ด๋‹ค. Estimator๋„ ๋žœ๋ค์ด๋‹ค. ์ฆ‰ ์ด๋ง์€ ๋ถ„ํฌ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค๊ณ  ํ•˜๊ณ  ๊ทธ ๋ถ„ํฌ๋ฅผ Sampling Distribution์ด๋ผ๊ณ  ํ•œ๋‹ค. 

 

 

๋‘ ๋ฒˆ์งธ ๋˜์ง„ ๊ฒฝ์šฐ์˜ ๋ถ„ํฌ

 

30๊ฐœ์”ฉ 50๊ฐœ๋ฅผ ๊ทธ๋ ค๋ณธ ๊ฒฝ์šฐ.

X๋ฐ”์˜ ๊ธฐ๋Œ“๊ฐ’์€ ๋ฎค์ด๊ณ  X๋ฐ”์˜ ์ •๊ทœ๋ถ„ํฌ์˜ ํ‰๊ท ์€ 0์ด๊ณ  ํ‘œ์ค€ ํŽธ์ž๋Š” 1/30์— ํ•ด๋‹นํ•œ๋‹ค. 

ํ‰๊ท ์ธ 0์— ๋Œ€์นญ์ด ๋˜์–ด์•ผ ํ•˜๋Š”๋ฐ ์ด ๋ถ„ํฌ๋Š” ๋Œ€์นญ์ด ์•„๋‹ˆ๋‹ค. Precision๊ณผ Bias๋ฅผ ๋ฐฐ์› ์—ˆ๋‹ค. ๋„“๊ฒŒ ํผ์งˆ ์ˆ˜๋ก ์ •๋„๊ฐ€ ๋” ์ž‘์€ ๊ฒƒ์ด๋‹ค. ๋„“์ด๊ฐ€ ๋„“์„ ์ˆ˜๋ก ์ •๋„๊ฐ€ ๋” ์ž‘๊ณ  ์ข‹์€ ๋ถ„ํฌ์ด๋‹ค.

 

 

๋น„ํ‘œ๋ณธ์˜ค์ฐจ๋Š” Census์—์„œ ์ผ์–ด๋‚  ์ˆ˜ ์žˆ๋Š” ์˜ค์ฐจ๋ฅผ ์˜๋ฏธํ•œ๋‹ค. ์ „์ˆ˜ ์กฐ์‚ฌ์—์„œ ์ผ์–ด๋‚˜๋Š” ์˜ค์ฐจ๋ฅผ ๋งํ•œ๋‹ค. 

์ธก์ •๊ฐ’์€ ์ฐธ๊ฐ’๊ณผ ์˜ค์ฐจ๋ฅผ ๊ฐ€์ง€๊ณ  ์žˆ๋‹ค. ๊ทธ๋ ‡๋‹ค๋ฉด ์ถ”์ •๋Ÿ‰์˜ ๊ธฐ๋Œ“๊ฐ’์—๋Š” ์ฐธ๊ฐ’๊ณผ ํŽธ์˜๊ฐ€ ๋“ค์–ด์žˆ๋‹ค. Expertation์„ ๋‹ค๋ฅธ ๋ง๋กœ Long run Average๋ผ๊ณ  ํ‘œํ˜„ํ•œ๋‹ค. ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” ๋ฎค์˜ ๊ฐ’์— ๊ฐ€๊นŒ์›Œ์ง€๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

 

์ž˜๋ชป ํ‘œ๊ธฐํ•œ ๊ฒฝ์šฐ ๋ฐœ์ƒํ•˜๋Š” ์˜ค์ฐจ๋ฅผ ๋น„ํ‘œ๋ณธ์˜ค์ฐจ๋ผ๊ณ  ํ•œ๋‹ค. ์˜ค์ฐจ๋Š” ํ‘œ๋ณธ ์˜ค์ฐจ์™€ ๋น„ํ‘œ๋ณธ ์˜ค์ฐจ์˜ ํ•ฉ์„ ์˜๋ฏธํ•œ๋‹ค.

๋ฐ˜๋ณต ์ธก์ •ํ•˜๋ฉด ํ‘œ๋ณธ ์˜ค์ฐจ๊ฐ€ ์—†์–ด์ง„๋‹ค.

 

 

ํ‘œ์ค€์˜ค์ฐจ

X๊ฐ€ ๋ฎค์™€ ์‹œ๊ทธ๋งˆ ^2์˜ ๋ถ„ํฌ๋ฅผ ๊ฐ€์ง„๋‹ค๊ณ  ํ•˜์ž. X๋ฐ”๋Š” ํ†ต๊ณ„๋Ÿ‰์ธ ๋™์‹œ์— ์ถ”์ •๋Ÿ‰์ธ๋ฐ ์ด๊ฒƒ์˜ ๊ธฐ๋Œ“๊ฐ’์ธ E(X๋ฐ”)๋Š” ๋ถˆํŽธ์ถ”์ •๋Ÿ‰์ด๋ผ๊ณ  ํ•œ๋‹ค. ์˜ค์ฐจ๊ฐ€ ์—†๋Š” Unbiased์ด๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. V(X๋ฐ”)์˜ ๊ฒฝ์šฐ ์‹œ๊ทธ๋งˆ^2/N์ด๋ผ๊ณ  ํ‘œํ˜„ํ•œ๋‹ค. ํ‘œ์ค€ํŽธ์ฐจ์— ํ•ด๋‹นํ•œ๋‹ค. X๋ฐ”์˜ Standard Deviation์€ ํ‘œ์ค€ํŽธ์ฐจ์ด๋‹ค. ๋ถ„ํฌ์— ์žˆ์–ด์„œ ํ‘œ์ค€ํŽธ์ฐจ๋Š” ์–ผ๋งˆ๋‚˜ ํฉ์–ด์ ธ์žˆ๋Š”์ง€๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ์ฒ™๋„์ด๋‹ค. X๋ฐ”์˜ ์ธก์ •์„ ๋‚˜ํƒ€๋‚ผ ์ˆ˜ ์ž‡๋Š” ์ฒ™๋„์ด๋‹ค. (*********)

 

์ผ๋ฐ˜์ ์ธ ๊ฒฝ์šฐ ์œ ํ•œ ๋ชจ์ง‘๋‹จ์˜ ํ‘œ์ค€ ํŽธ์ฐจ๋Š” ํ‘œ๋ณธ ํ‘œ์ค€ ํŽธ์ฐจ์— ์–ด๋–ค ๊ฐ’์„ ๊ณฑํ•˜๊ฒŒ ๋˜๋Š”๋ฐ finite ๊ฐ’์„ ๊ณฑํ•˜๊ฒŒ ๋œ๋‹ค. ๋ณด์ •์ด๋ผ๊ณ  ๋ณด๋ฉด ๋œ๋‹ค. 

ํ‘œ๋ณธ ํ‰๊ท ์˜ ํ‘œ๋ณธ ๋ถ„ํ‘œ์—์„œ X๋ฐ”์˜ ํ‰๊ท ์€ ๋ฎค์— ํ•ด๋‹นํ•œ๋‹ค. X๋ฐ”์˜ ๋ถ„์‚ฐ์€ ์‹œ๊ทธ๋งˆ^2/n์— ํ•ด๋‹นํ•œ๋‹ค. ์›๋ž˜ ํ‘œ์ค€ํŽธ์ฐจ์ธ ์‹œ๊ทธ๋งˆ์— ๋น„ํ•ด ๋ฃจํŠธn ๋งŒํผ ๋Š๋ฆฌ๊ฒŒ ์˜ค์ฐจ๊ฐ€ ์ค„์–ด๋“ค๊ณ  ์žˆ๋‹ค๋Š” ๊ฒƒ์ด๋‹ค. 

 

X๋ฐ” - ๋ฃจํŠธ n ๋ถ„์˜ 1 ์ด๋ผ๊ณ  ํ–ˆ์„ ๋•Œ ์ด๋Š” ๋ถˆํŽธ ์ถ”์ •๋Ÿ‰์ด ์•„๋‹ˆ๋‹ค. E(x๋ฐ” - ๋ฃจํŠธ n๋ถ„์˜ 1)์€ Bias๊ฐ€ ์กด์žฌํ•˜๋ฏ€๋กœ ๋ถˆํŽธ ์ถ”์ •๋Ÿ‰์ด ์•„๋‹ˆ๋‹ค. Bias๊ฐ€ - ๋ฃจํŠธ n๋ถ„์˜ 1 ๋งŒํผ ์กด์žฌํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ์ด๋•Œ N์„ ์ถฉ๋ถ„ํžˆ ํ‚ค์› ์„ ๋•Œ Unbias๊ฐ€ ๋œ๋‹ค. ๊ทธ๋Ÿฐ ๊ฒƒ์„ ์ผ์น˜ ์ถ”์ •๋Ÿ‰์ด๋ผ๊ณ  ํ•œ๋‹ค. ๊ฐœ๋…๋งŒ ์•Œ์•„๋‘๋ผ๊ณ  ๋ง์”€ํ•˜์‹ฌ.

 

 

 

 

X ๋ชจ์ง‘๋‹จ์ด ์ •๊ทœ๋ถ„ํฌ๋ฅผ ๋”ฐ๋ฅธ๋‹ค. ๋ถ„์‚ฐ์ด N์˜ ํฌ๊ธฐ๊ฐ€ ํด์ˆ˜๋ก ๋ถ„์‚ฐ์ด ์ž‘์•„์ง€๊ณ  d์ฒ˜๋Ÿผ ๋ถ„์‚ฐ์ด ์ž‘์•„์ง€๋Š” ๋ชจ์Šต์„ ๋ณผ ์ˆ˜ ์žˆ๋‹ค. 

 

 

์ •๊ทœ๋ถ„ํฌ๊ฐ€ ์•„๋‹Œ ๊ฒฝ์šฐ 

X๋ฐ”์˜ ๊ฒฝ์šฐ ๋ถ„ํฌ์— ๊ด€๊ณ„์—†์ด ํ‰๊ท ์€ ๋ฎค, ๋ถ„์‚ฐ์€ ์‹œ๊ทธ๋งˆ^2/N์ด ๋œ๋‹ค. Xi์˜ ๋ถ„ํฌ๋Š” ๋ชจ๋ฅด์ง€๋งŒ X๋ฐ”์˜ ๋ถ„ํฌ๋Š” ์•Œ๊ณ  ์žˆ๋‹ค. Limit Theorem์€ N์ด ๋ฌดํ•œ๋Œ€๋กœ ๊ฐˆ ๋•Œ์˜ ๊ฒฝ์šฐ๋ฅผ ๋งํ•œ๋‹ค. n์ด large enough 30 ์ด๋ฉด ์ถฉ๋ถ„ํ•˜๋‹ค๊ณ  ํ‘œํ˜„ํ•œ๋‹ค.