본문 바로가기

통계학17

06-1 다양한 가설검정 1. 가설검정 방법 구분해서 사용하기가설검정은 다양한 목적・가설을 대상으로 시행 [BUT] 해석 목적・데이터 성질에 따라 가설검정 방법이 달라짐[TIP] 가설검정 해석의 흐름① 확인하고 싶은 대상에 따라, 귀무가설 vs 대립가설을 설정 ② 데이터를 통해, 가설검정에 필요한 검정통계량 계산③ 귀무가설이 옳다는 가정하에, 통계량의 분포를 생각 → 데이터로 계산한 통계량이 분포의 어느 위치에 있는지를 구함 ⇒ p값 계산귀무가설・검정통계량(or 그 분포)은 가설검정 방법에 따라 달라짐 / 필요한 검정통계량 또한 데이터 유형(양적 변수 or 질적 변수) ・ 데이터 성질에 따라 다름       ⇒ ∴ 가설검정 방법을 선택할 때, 데이터 유형(양적변수 vs 질적변수) ・ 표본의 수 ・ 양적 변수 분포의 성질 을 먼저.. 2024. 7. 6.
05-4 제1종 오류 ・ 제2종 오류 1. 진실과 판단의 4패턴가설검정 : 귀무가설 & 대립가설을 고려 (서로 대립 관계x, 부정 관계o)진실 : 2가지 패턴          (i) 귀무가설(참) & 대립가설(거짓)          (ii) 귀무가설(거짓) & 대립가설(참)판단 : 2가지 패턴 at 가설검정, p값 계산 → 유의수준 𝝰와 비교 ⇒ 대립가설을 지지할지, 판단을 보류할지 결정          (i) p           (ii) p ≥ 𝝰 : 귀무가설을 기각할 수 x진실과 판단은 2x2 패턴- 왼쪽 위 칸 : 귀무가설 "참" → 귀무가설을 기각하지x (O)- 오른쪽 아래 칸 : 대립가설 "참" → 대립가설 채택 (O)- 왼쪽 아래 칸 : 귀무가설 "참" → 귀무가설 기각, 대립가설 채택 (X) "제1종 오류(일어날 확률 𝝰.. 2024. 7. 6.
05-3 가설검정 관련 그래프 1. 오차 막대(error bar)반복이 있는 데이터에서, 평균값을 계산하여 막대그래프・산점도를 그릴 때; 평균값 & 오차막대 를 함께 그림오차 막대는 목적에 따라 구별하여 사용① 평균값의 확률을 나타낼 때 : 평균값 ± 표준오차(SEM; mean ± SE)사용    *SEM : standard error of the mean   - 평균값의 표준오차 : s / √n    *s : 비편향표준편차② 신뢰구간을 나타낼 때 : 평균값을 중심으로, 95% 신뢰구간을 그림③ 데이터 퍼짐을 나타낼 때 : 평균값 ± 표준편차(mean ± SD) 사용   - 이 경우 평균값의 확률이 x, 단순히 데이터가 어느 정도 퍼져 있는 지를 시각화하고 있을 뿐- 오차 막대가 무엇을 나타내는지를 범례에 반드시 기재- at 가설검정.. 2024. 7. 5.
05-2 가설검정 시행 1. 가설검정의 구체적인 계산가설검정의 흐름을 알았으니, 이제 실제로 p값을 어떻게 계산할지 알아보자!가설검정의 개념은 다양한 검정기법에서 공통 [BUT] p값의 계산방법은 서로 다름[EX] 이표본 t검정(two-sample t-test) : 2개 집단 간의 평균값을 비교하는 검정 - 모집단평균과 표본평균의 관계 : '표본평균의 차이 ・ 모집단평균의 차이'의 차이 (x̅ᴬ -  x̅ᴮ)-(𝜇ᴬ - 𝜇ᴮ) → 정규분포를 근사적으로 따름   * ∆x = x̅ᴬ -  x̅ᴮ, ∆𝜇 = 𝜇ᴬ - 𝜇ᴮ 라 두면 ∆x - ∆𝜇 가 되므로~- 귀무가설이 옳다고 가정; 𝜇ᴬ - 𝜇ᴮ = 0 을 대입 → 귀무가설이 옳은 세계's 표본평균 차이(x̅ᴬ -  x̅ᴮ)의 근사적인 분포를 얻을 수 o[IF] 표본.. 2024. 7. 5.
05-1 가설검정의 원리 1. 추론통계 방법신뢰구간 : 모수가 어느 범위 안에 있는지를 확률적으로 보여주는 방법가설검정 : 분석자가 세운 가설을 검증하기 위한 방법1) 가설 검증하기가설검정에서는 p값(p-value)이라는 수치를 계산하여 가설을 지지하는지 여부를 판단확증적 자료분석(가설검증형 데이터 분석) : 미리 세운 가설을 검증하는 접근법탐색적 자료분석 : 가설을 미리 세우지 않고, 전체 데이터를 탐색적으로 해석하는 접근법- 확증적 자료분석 : 새로 개발한 신약 1종에 주목하여 "신약에 효과가 있다."라는 가설을 미리 세운 다음, 실험을 수행하고 검증함; 세운 가설을 검증하는 데 목적이 있음- 탐색적 자료분석 : 어떤 약이 효과가 있는지 가설을 세우지x, 새롭게 만든 다른 종류의 약을 계속 추가하여 데이터를 얻음; 데이터의 .. 2024. 7. 5.
04-3 신뢰구간 📖 신뢰구간이란?표본오차의 확률분포를 통해, 얼마나 큰 오차가 어느 정도의 확률로 나타나는지 확인→ 이 때 오차를 정량화하기 위해, 신뢰구간(confidence interval) 개념 도입at 표준정규분포, (𝜇 - 2𝝈) ~ (𝜇 + 2𝝈) 범위에 약 95%의 값이 포함됨; 표준정규분포에서 하나의 값을 무작위로 꺼내면 약 95%의 확률로 그 범위에 포함된다는 뜻표본오차(x̅ - 𝜇)의 정규분포; 노란색・초록색 박스가 95% 신뢰구간 1. 신뢰구간 개념 알기1) 신뢰구간의 해석'○○% 신뢰구간' : "○○%의 확률로 이 구간에 모집단평균 𝜇가 존재"- 이 때, 확률변수는 표본평균 x̅(or 신뢰구간) 모집단평균 𝜇가 x- 모집단에서 표본을 추출하여 ○○% 신뢰구간을 구하는 작업을 100번 .. 2024. 7. 4.