1. 추론통계 방법
- 신뢰구간 : 모수가 어느 범위 안에 있는지를 확률적으로 보여주는 방법
- 가설검정 : 분석자가 세운 가설을 검증하기 위한 방법
1) 가설 검증하기
- 가설검정에서는 p값(p-value)이라는 수치를 계산하여 가설을 지지하는지 여부를 판단
- 확증적 자료분석(가설검증형 데이터 분석) : 미리 세운 가설을 검증하는 접근법
- 탐색적 자료분석 : 가설을 미리 세우지 않고, 전체 데이터를 탐색적으로 해석하는 접근법
- 확증적 자료분석 : 새로 개발한 신약 1종에 주목하여 "신약에 효과가 있다."라는 가설을 미리 세운 다음, 실험을 수행하고 검증함; 세운 가설을 검증하는 데 목적이 있음
- 탐색적 자료분석 : 어떤 약이 효과가 있는지 가설을 세우지x, 새롭게 만든 다른 종류의 약을 계속 추가하여 데이터를 얻음; 데이터의 특징을 파악・가설 후보를 찾는 데 목적이 있음
2) 가설검정
- 가설검정(hypothesis testing, statistical hypothesis testing)
- [EX] 신약을 투여한 집단A(실험군) vs 위약을 투여한 집단B(대조군) 을 비교; 신약의 효과를 검증
- "신약에 효과가 있다"라는 가설을 세우고 이를 검증해 나감
- 서로 비교할 2개 이상의 (특정 동일 조건의)집단 : 군(그룹)
- 실험군treatment group : 어떠한 조치를 취한 집단 / 대조군control group : 실험군과 비교・대조를 위해 마련한 집단
2. 통계학에서 가설이란?
- 가설 : 신약에 효과가 있다 ⇒ (모집단 A의 평균값 𝜇ᴬ) ≠ (모집단 B의 평균값 𝜇ᴮ) 으로 나타낼 수 있음
- [주의] 세운 가설은 모집단을 대상으로 한 가설 표본(데이터)을 대상으로 한 가설이 x
1) 귀무가설과 대립가설
- 귀무가설이 옳다면 대립가설이 틀리고, 귀무가설이 틀리다면 대립가설이 옳은 관계
- 가설검정 : 귀무가설과 대립가설을 세운 다음, 데이터로 귀무가설을 부정하여 대립가설을 지지하는 흐름 ≒ 귀류법(배리법) : 밝히고자 하는 명제가 잘못되었다고 가정한 뒤, 모순을 발견함으로써 명제를 증명
- [BUT] 귀무가설・대립가설에는 비대칭성이 있음 ∴대립가설을 부정하여 귀무가설을 지지하는 것은 불가능
① 귀무가설(null hypothesis) : 밝히고자 하는 가설(대립가설)의 부정 명제
- 귀무가설 "신약에 효과가 없다 𝜇ᴬ = 𝜇ᴮ "
② 대립가설(alternative hypothesis) : 밝히고자 하는 가설
- 대립가설 "신약에 효과가 있다 𝜇ᴬ ≠ 𝜇ᴮ "
2) 모집단과 표본의 관계 다시 살펴보기
- 정말로 알고 싶은 모집단의 성질(𝜇ᴬ, 𝜇ᴮ); 직접 관찰할 수 x → 모집단에서 추출한 표본을 분석; 모집단의 성질을 추정
- 모집단에서 얻은 표본평균 x̅ᴬ, x̅ᴮ ≠ 모집단평균 𝜇ᴬ, 𝜇ᴮ; 표본오차(데이터 퍼짐이 있는 모집단에서 무작위로 표본을 추출할 때 생기는 어쩔 수 없는 오차) → 귀무가설(𝜇ᴬ = 𝜇ᴮ)이 옳다 하더라도 x̅ᴬ ≠ x̅ᴮ가 됨
- 즉, 약에 아무 효과가 없더라도 x̅ᴬ - x̅ᴮ ≠ 0 → 표본평균에 차이(x̅ᴬ - x̅ᴮ)가 생김; 이 때 표본평균의 차이(x̅ᴬ - x̅ᴮ)가 귀무가설이 옳을 때에도 생기는 단순한 데이터 퍼짐인지 or 정말로 약의 효과인지 구별해야함 "가설검정의 바탕이 되는 사고방식"
- 같은 분포에서 2개의 표본을 얻었을 때, 모집단 A, B의 평균이 같더라도, 표본평균 x̅ᴬ, x̅ᴮ 는 각각 𝜇ᴬ, 𝜇ᴮ와 어긋나므로 x̅ᴬ ≠ x̅ᴮ가 됨
3) 귀무가설이 옳은 세계 상상하기
- "가설검정의 바탕이 되는 사고방식" : 표본평균의 차이(x̅ᴬ - x̅ᴮ)가 귀무가설이 옳을 때에도 생기는 단순한 데이터 퍼짐인지 or 정말로 약의 효과인지 구별 → 귀무가설이 틀렸는지를 조사
① 귀무가설이 옳다고 가정; 두 모집단 평균이 동일(𝜇ᴬ = 𝜇ᴮ)
② 모집단A, B에서 각각 표본 추출; 표본평균은 표본을 얻을 때마다 확률적으로 변동 → 표본평균의 차이(x̅ᴬ - x̅ᴮ) 발생; 이는 𝜇ᴬ = 𝜇ᴮ 여도 발생
③ ②를 여러 번 반복 → 표본평균의 차이(x̅ᴬ - x̅ᴮ)를 히스토그램으로 그려봄; 귀무가설이 옳은 세계에서 x̅ᴬ - x̅ᴮ 가 확률적으로 어떻게 발생하는지 나타낸 분포
- x̅ᴬ - x̅ᴮ 는 평균적으로 0
- x̅ᴬ - x̅ᴮ 는 0에 가까운 값이 나타나기 쉬움
3. p값
- "가설검정에서 가장 중요한 사고방식" : 현실세계의 실제 데이터로 계산한 표본평균의 차이(x̅ᴬ - x̅ᴮ)는 귀무가설이 옳은 가상세계에서 어떤 빈도로 발생할까?
- 현실세계의 실제 데이터로 계산한 표본평균의 차이(x̅ᴬ - x̅ᴮ)가 가상 세계에서는 극히 드물다면(중심인 0에서 멈), 가상 세계가 틀렸다고 말할 수 있음; 가상 세계의 "귀무가설(신약에 효과가 없다 𝜇ᴬ = 𝜇ᴮ)이 옳다."라는 가정이 틀렸을 가능성↑
- 현실세계의 실제 데이터로 계산한 표본평균의 차이(x̅ᴬ - x̅ᴮ)가 가상 세계에서도 자주 나타난다면(중심인 0에 가까움), 가상 세계가 틀렸다고 말할 수 없음; 가상 세계의 "귀무가설(신약에 효과가 없다 𝜇ᴬ = 𝜇ᴮ)이 옳다."라는 가정이 옳을 가능성↑
- 현실세계의 실제 데이터로 계산한 표본평균의 차이(x̅ᴬ - x̅ᴮ)가 귀무가설이 옳은 가상세계에서 얼마나 나타나기 쉬운지・어려운지를 평가 by p값(p-value)
1) p값(p-value)
- 정의 : 귀무가설(ex : 신약에 효과가 없다 𝜇ᴬ = 𝜇ᴮ)이 옳다고 가정했을 때, 관찰한 값(ex : 표본평균의 차이(x̅ᴬ - x̅ᴮ)) 이상으로 극단적인 값이 나올 확률을 일컫음
- 즉, p값은 귀무가설과 현실 데이터 간의 괴리 정도를 평가
- p값은 확률이므로, 0 ≤ p ≤ 1
- p값이 小 : at 귀무가설(신약에 효과가 없다 𝜇ᴬ = 𝜇ᴮ)이 옳은 세계, 현실에서 얻은 데이터(표본평균의 차이(x̅ᴬ - x̅ᴮ)값)가 잘 나타나지x((x̅ᴬ - x̅ᴮ)값이 드묾 구역에서 나타남; 0에서 멈) "가상세계의 귀무가설은 틀렸을 가능성↑; 대립가설(신약에 효과가 있다 𝜇ᴬ ≠ 𝜇ᴮ)이 옳을 가능성↑"
- EX : 현실에서 얻은 데이터 "표본평균의 차이(x̅ᴬ - x̅ᴮ) = +10" & p=0.01 ⇒ 귀무가설이 옳은 세계에서 표본평균의 차이(x̅ᴬ - x̅ᴮ)값이 ≥ +10 or ≤ - 10 일 확률은 1%
2) p값과 유의수준 𝝰를 이용한 가설 판정
(i) p ≤ 0.05
- 귀무가설 하에, 현실 데이터는 나타나기 어렵다고 판단
- 귀무가설을 기각 & 대립가설을 채택
- 이 때 평균값의 차이는 "통계적으로 유의미한(statistically significant) 차이가 있다"고 표현
- [BUT] 대립가설이 절대적으로 옳다는 뜻이 x, 대립가설을 지지하는 하나의 증거를 얻음을 의미
(ii) p ≥ 0.05
- 귀무가설을 기각할 수 x
- 이 때 평균값의 차이는 "통계적으로 유의미한 차이가 없다"고 표현
- [BUT] 귀무가설이 옳다는 뜻이 x, 귀무가설이 틀렸다고 말할 수 x 라는 의미; 어느 명제가 옳은가의 판단을 보류
3) 유의수준 𝝰
- 정의 : 귀무가설을 기각할 것인지 채택할 것인지의 판단 경계로 이용하는 값
- at 과학계, 보통 𝝰 = 0.05 를 이용
4. 가설검정 흐름 정리
- 가설검정 흐름
① 모집단을 대상으로 귀무가설 & 대립가설을 설정
② 실험・관찰로 표본 데이터를 얻음
③ 귀무가설이 옳은 세계를 가정 → 현실 데이터가 그곳에서 얼마나 잘 나타나는지를 p값으로 평가
④ (i) p값이 유의수준 0.05 보다 작다면; 귀무가설 기각 & 대립가설 채택
(ii) p값이 유의수준 0.05 보다 크다면; 귀무가설 기각x, 판단 보류
출처 : ⎡통계101 x 데이터 분석 (아베 마사토)⎦
'통계학 > 05. 가설검정' 카테고리의 다른 글
05-4 제1종 오류 ・ 제2종 오류 (0) | 2024.07.06 |
---|---|
05-3 가설검정 관련 그래프 (0) | 2024.07.05 |
05-2 가설검정 시행 (1) | 2024.07.05 |