본문 바로가기
통계학/02. 모집단과 표본

02-2 모집단

by gamdong2 2024. 6. 9.

1. 모집단 설정 방법

  • 모집단 : 데이터 분석에서 알고자하는 대상 전체
  • 데이터 분석 목적 & 알고자 하는 대상에 기초하여 모집단을 설정

BUT, 알고자 하는 대상이 전체일지라도, 실제로 데이터를 얻을 가능성이 없는 요소를 포함한 모집단은 적절하지x
   [ex] 모든 고혈압 환자를 대상으로 하고 싶음
   → BUT 여성 환자의 데이터를 얻을 수 없는 경우, 고혈압 남성 환자를 모집단으로 설정하는 것이 적절함

[ex1] 데이터 분석의 목적 : 한국인 성인 남성의 키를 알아내는 것
→ 모집단 : 한국인 성인 남성 전원

[ex2] 데이터 분석의 목적 : 모든 눈이 정확히 균등한 확률로 나오는 주사위인지・특정 눈이 더 잘 나오는 주사위인지 알아내는 것
→ 모집단 : 그 주사위를 무한하게 던졌을 때 나오는 눈의 전체 집합

 

2. 모집단의 크기

모집단의 크기 : 모집단에 포함된 요소(element)의 수. 모집단은 그 크기에 따라 유한모집단, 무한모집단으로 나뉨

* 모집단 크기 ≠ 모수(population parameter; 모집단의 특성치(ex : 평균값)

 

1) 유한모집단

  • 모집단 중 한정된 요소만 포함한 것
  • ex : '1반과 2반 중 어느 반의 평균 점수가 높은지 알아내기' → 1반과 2반 각 40명 '유한모집단'

2) 무한모집단

  • 모집단 중 포함된 요소의 개수가 무한한 것
  • ex1 : '신약의 효과 알아내기' → 현재 뿐만 아니라, 미래의 고혈압 환자도 복용 대상에 포함됨 '무한모집단'
  • ex2 : '주사위' → 몇 번이고 던질 수 있음 '무한모집단

 

3. 모집단의 성질

모집단의 성질 : 모집단에 포함된 요소를 특징 짓는 값 ex : 한국인 남성의 평균 키는 172.5cm 이다.

  • 모집단의 성질을 알 수 있다면, 대상을 설명・이해할 수 있음 & 미지의 데이터를 예측할 수 있음
  • 모집단의 성질을 알기 위한 방법 : 전수조사, 표본조사

 

1) 전수조사

  • 전수조사 : 모집단에 포함된 요소의 개수가 한정된, 유한모집단일 때 선택할 수 있는 조사 방법
  • 분석할 데이터 = 모집단
  • 획득한 데이터의 특징을 파악하고 기술(기술통계;descriptive statistics)하기만 해도, 모집단의 성질을 설명・이해할 수 있음
  • BUT 비용・시간 면에서 부담이 막대하여 실현 불가능한 경우가 대부분

2) 표본조사

  • 추론통계(inferential statistics) : 모집단의 일부를 분석하여 모집단 전체의 성질을 추정
  • 표본(sample) : 추론통계에서 조사하는 모집단의 일부
  • 표본추출(sampling) : 모집단에서 표본을 뽑는 것
  • 표본조사 : 표본을 이용해 모집단의 성질을 조사하는 것
  • 표본크기(sample size, 'n') : 표본에 포함된 요소의 개수
  • 샘플 수 : 표본의 개수
[ex] 표본A(20명), 표본B(30명) → 표본크기 n=20, n=30 / 샘플 수 2(표본 A, B)

 

 

 

 

 

출처 : ⎡통계101 x 데이터 분석 (아베 마사토)