본문 바로가기

분류 전체보기192

05-3 가설검정 관련 그래프 1. 오차 막대(error bar)반복이 있는 데이터에서, 평균값을 계산하여 막대그래프・산점도를 그릴 때; 평균값 & 오차막대 를 함께 그림오차 막대는 목적에 따라 구별하여 사용① 평균값의 확률을 나타낼 때 : 평균값 ± 표준오차(SEM; mean ± SE)사용    *SEM : standard error of the mean   - 평균값의 표준오차 : s / √n    *s : 비편향표준편차② 신뢰구간을 나타낼 때 : 평균값을 중심으로, 95% 신뢰구간을 그림③ 데이터 퍼짐을 나타낼 때 : 평균값 ± 표준편차(mean ± SD) 사용   - 이 경우 평균값의 확률이 x, 단순히 데이터가 어느 정도 퍼져 있는 지를 시각화하고 있을 뿐- 오차 막대가 무엇을 나타내는지를 범례에 반드시 기재- at 가설검정.. 2024. 7. 5.
05-2 가설검정 시행 1. 가설검정의 구체적인 계산가설검정의 흐름을 알았으니, 이제 실제로 p값을 어떻게 계산할지 알아보자!가설검정의 개념은 다양한 검정기법에서 공통 [BUT] p값의 계산방법은 서로 다름[EX] 이표본 t검정(two-sample t-test) : 2개 집단 간의 평균값을 비교하는 검정 - 모집단평균과 표본평균의 관계 : '표본평균의 차이 ・ 모집단평균의 차이'의 차이 (x̅ᴬ -  x̅ᴮ)-(𝜇ᴬ - 𝜇ᴮ) → 정규분포를 근사적으로 따름   * ∆x = x̅ᴬ -  x̅ᴮ, ∆𝜇 = 𝜇ᴬ - 𝜇ᴮ 라 두면 ∆x - ∆𝜇 가 되므로~- 귀무가설이 옳다고 가정; 𝜇ᴬ - 𝜇ᴮ = 0 을 대입 → 귀무가설이 옳은 세계's 표본평균 차이(x̅ᴬ -  x̅ᴮ)의 근사적인 분포를 얻을 수 o[IF] 표본.. 2024. 7. 5.
05-1 가설검정의 원리 1. 추론통계 방법신뢰구간 : 모수가 어느 범위 안에 있는지를 확률적으로 보여주는 방법가설검정 : 분석자가 세운 가설을 검증하기 위한 방법1) 가설 검증하기가설검정에서는 p값(p-value)이라는 수치를 계산하여 가설을 지지하는지 여부를 판단확증적 자료분석(가설검증형 데이터 분석) : 미리 세운 가설을 검증하는 접근법탐색적 자료분석 : 가설을 미리 세우지 않고, 전체 데이터를 탐색적으로 해석하는 접근법- 확증적 자료분석 : 새로 개발한 신약 1종에 주목하여 "신약에 효과가 있다."라는 가설을 미리 세운 다음, 실험을 수행하고 검증함; 세운 가설을 검증하는 데 목적이 있음- 탐색적 자료분석 : 어떤 약이 효과가 있는지 가설을 세우지x, 새롭게 만든 다른 종류의 약을 계속 추가하여 데이터를 얻음; 데이터의 .. 2024. 7. 5.
04-3 신뢰구간 📖 신뢰구간이란?표본오차의 확률분포를 통해, 얼마나 큰 오차가 어느 정도의 확률로 나타나는지 확인→ 이 때 오차를 정량화하기 위해, 신뢰구간(confidence interval) 개념 도입at 표준정규분포, (𝜇 - 2𝝈) ~ (𝜇 + 2𝝈) 범위에 약 95%의 값이 포함됨; 표준정규분포에서 하나의 값을 무작위로 꺼내면 약 95%의 확률로 그 범위에 포함된다는 뜻표본오차(x̅ - 𝜇)의 정규분포; 노란색・초록색 박스가 95% 신뢰구간 1. 신뢰구간 개념 알기1) 신뢰구간의 해석'○○% 신뢰구간' : "○○%의 확률로 이 구간에 모집단평균 𝜇가 존재"- 이 때, 확률변수는 표본평균 x̅(or 신뢰구간) 모집단평균 𝜇가 x- 모집단에서 표본을 추출하여 ○○% 신뢰구간을 구하는 작업을 100번 .. 2024. 7. 4.
중간점검) 표준편차, 표본오차, 표준오차 용어 정리 1. 배경 이론1) 내 필기.. 2) 용어 정리확률변수 X : 어떤 사건・현상을 실수로 전환하는 함수확률분포 : 각각의 확률변수 값이 나타날 확률의 분포를 나타낸 것- 확률분포 ⊃ 이산형 확률분포, 연속형 확률분포 - 이산형 확률분포 ⊃ 이항분포, 포아손분포, 기하분포, 초기하분포 등 - 연속형 확률분포 ⊃ 정규분포, f 분포, t 분포, chi-square 분포 등정규분포 : 평균을 중심으로 좌우대칭인 연속형 확률변수's 확률분포 X~N(𝜇, 𝝈²) : 확률변수X(평균𝜇, 분산𝝈²)의 정규분포중심극한정리 : 표본크기 n이 일정 이상 크다면 모집단의 분포가 무엇이든 간에 표본평균x̅의 분포는 정규분포(평균𝜇, 표준편차𝝈/√n)를 따름표준정규분포 : 확률변수Z = (X-𝜇)/𝝈 Z~N(0, 1) : 확률변.. 2024. 7. 4.
02-8 자료형의 값을 저장하는 공간, 변수 >>> a = [1, 2, 3]>>> b = a[:] #리스트 a의 처음~끝 요소 슬라이싱>>> a[1] = 4>>> a[1, 4, 3]>>> b[1, 2, 3] #리스트 a의 값을 바꾸더라도 리스트 b에 영향x📖 변수란?변수의 형태 : '변수 이름 = 변수에 저장할 값'at 파이썬, 변수 ≒ 객체객체 : 자료형의 데이터(값)다음의 a, b, c 같은 예를 '변수'라 함>>> a = 1>>> b = "python">>> c = [1, 2, 3][Ex] a = [1, 2, 3]# [1, 2, 3] 값을 가지는 리스트 데이터(객체)가 자동으로 메모리에 생성됨# 변수 a는 [1, 2, 3] 리스트가 저자오딘 메모리의 주소를 가리킴>>> a = [1, 2, 3]>>> id(a)    #파이썬 내장 함수.. 2024. 6. 27.