1. 가설검정의 구체적인 계산
가설검정의 흐름을 알았으니, 이제 실제로 p값을 어떻게 계산할지 알아보자!
- 가설검정의 개념은 다양한 검정기법에서 공통 [BUT] p값의 계산방법은 서로 다름
- [EX] 이표본 t검정(two-sample t-test) : 2개 집단 간의 평균값을 비교하는 검정
- 모집단평균과 표본평균의 관계 : '표본평균의 차이 ・ 모집단평균의 차이'의 차이 (x̅ᴬ - x̅ᴮ)-(𝜇ᴬ - 𝜇ᴮ) → 정규분포를 근사적으로 따름
* ∆x = x̅ᴬ - x̅ᴮ, ∆𝜇 = 𝜇ᴬ - 𝜇ᴮ 라 두면 ∆x - ∆𝜇 가 되므로~
- 귀무가설이 옳다고 가정; 𝜇ᴬ - 𝜇ᴮ = 0 을 대입 → 귀무가설이 옳은 세계's 표본평균 차이(x̅ᴬ - x̅ᴮ)의 근사적인 분포를 얻을 수 o
[IF] 표본크기 n이 크지 x & 𝝈 대신 s를 사용할 경우, t분포를 따름 정규분포와는 다소 어긋남
→ ∴ 더 이상 x̅ᴬ - x̅ᴮ 을 기준으로 정규분포를 그리지 x, t값(x̅ᴬ - x̅ᴮ을 s√(1/nᴬ + 1/nᴮ) 로 나누어 표준화한 값)을 기준으로 t분포를 그림; 귀무가설이 옳을 때의 t분포
⇒ 이 t분포에서 귀무가설을 기각할 것인지 판단하고자, 현실 데이터가 이 분포 가운데 어디에 위치하는지를 생각
- s는 비편향표준편차이긴 하지만, 여기서는 2개 집단이므로 계산 방법이 조금 다름
- sᴬ : A군의 비편향표준편차, sᴮ : B군의 비편향표준편차
[TIP] t분포
✻ t 분포의 형태
- 0 을 중심으로 좌우대칭(≒ 표준정규분포) 이나, 표준정규분포 보다 평평하고 기다란 꼬리를 가짐 (양쪽 꼬리가 두터운 형태); 즉, 표준정규분포 보다 분산이 크므로, 보다 평평한 모양을 가짐
- 자유도에 따라 다른 모양을 나타냄 (χ² 분포 도 이와 유사함)
- 자유도(= 표본의 수 - 1)가 증가할수록, 표준정규분포에 가까워짐; 대개, 자유도가 30 이 넘으면 표준정규분포와 비슷하게 됨
✻ t 분포의 확률변수의 변환
- t 분포의 확률변수 : T
- T : 모 평균 μ의 추정에 사용되는 추정 통계량(표준정규분포의 표준화 변량인 Z 처럼 표본평균x̅을 선형변환한 것
- 변환식
2. 기각역과 p값
- 분산분포's 가운데 부분 : 자주 일어나는 사건 / 분산분포's 양쪽 끝 : 잘 일어나지 않는 사건 → 이를 수치적으로 다루기 위해 양 끝 2.5%씩(합쳐서 5%)의 발생 범위를 잡음 "유의수준 5%인 기각역"
- 2.5%가 되는 t값 "2.5% 지점" (= 신뢰구간's 2.5% 지점)
- 실제로 얻은 값이 기각역에 포함될 때, p<0.05 가 됨; 귀무가설 하에 현실 데이터가 발생하기 어려울 것이라 간주 "귀무가설 기각"
- p값 : 귀무가설이 옳을 때, 현실 데이터가 t분포 내 어디에 위치하는지 구한 뒤 그 이상의 극단적인 값이 나올 확률
- [EX] 실제 값이 t=2.3 → p값 : t ≤ -2.3 일 확률 & t ≥ +2.3일 확률을 구한 것
- 양측검정 : 양수・음수 양쪽을 모두 고려하는 가설검정 방법 보통 이걸 이용
- 단측검정 : 어느 한쪽만 고려해 넓이를 계산하는 방법
1) 신뢰구간과 가설검정의 관계
- p값 계산 ≒ 신뢰구간 계산 ( 𝜇ᴬ - 𝜇ᴮ 의 95% 신뢰구간이 0에 걸치는지 여부) ≒ (p값이 0.05를 밑도는지 여부)
- 신뢰구간 : 실제 값(표본평균)으로 모집단평균을 추정
- 가설검정 : 귀무가설을 가정해 모집단평균을 𝜇ᴬ - 𝜇ᴮ = 0 으로 고정했을 때의 표본평균이 어떤 값이 될 것인지를 구함
- 신뢰구간 ・ 가설검정은 동전의 양면 같은 관계; 모집단 vs 표본 중 어느 쪽을 중심으로 생각하느냐의 차이일 뿐
2) 가설검정의 구체적인 예
[EX1] 2개 집단의 평균값 비교
- 실제 데이터로부터 표본평균의 차이 계산 : x̅ᴬ - x̅ᴮ = -10.9 → 이것이 단순한 데이터 퍼짐에 의한 것인지 or 신약의 효과 때문인지 판단하고 싶음
- 실제 데이터로부터 표본크기(nᴬ, nᴮ) ・ 비편향표준편차 s 계산 → t검정에 이용되는 t값 계산 : t = -2.73(실제 값)
- 귀무가설이 옳다는 가정하에, t값이 따르는 t분포를 그림 → 실제 값인 t = -2.73 의 위치를 조사 → t ≤ -2.73, t ≥ +2.73 이 될 확률(p)을 구함 "붉은색으로 색칠된 넓이의 합 = p"
- p = 0.018 "귀무가설이 옳다는 가정하에 표본평균의 차이 = -10.9 이상으로 극단적인 표본평균의 차이가 나타날 확률이 1.8%"
- p < 0.05 이므로 통계적으로 유의미한 차이를 가짐 "신약의 효과가 있음"
[EX2] 2개 집단의 평균값 비교
- EX1과 비교하여, 신약을 투여한 실험군(A군)의 혈압이 각각 6씩 높음
- 표본평균의 차이 : x̅ᴬ - x̅ᴮ = -4.9
- t = -1.22
- p = 0.246 "귀무가설이 옳다는 가정하에, 표본평균의 차이 = -4.9 이상의 극단적인 값이 나타날 확률 24.6%"
- p ≥ 0.05 이므로 귀무가설을 기각할 수 x, 판단 보류(귀무가설을 지지한다는 것이x, 귀무가설과 대립가설 중 어느 쪽도 지지할 수 없어 결론을 보류)
- 통계적으로 유의미한 차이가 없음
출처 : ⎡통계101 x 데이터 분석 (아베 마사토)⎦, http://www.ktword.co.kr/test/view/view.php?no=1134
'통계학 > 05. 가설검정' 카테고리의 다른 글
05-4 제1종 오류 ・ 제2종 오류 (0) | 2024.07.06 |
---|---|
05-3 가설검정 관련 그래프 (0) | 2024.07.05 |
05-1 가설검정의 원리 (0) | 2024.07.05 |