1. 통계학의 역할
퍼짐(산포, dispersion)이 있는 데이터에 대해 설명 or 예측을 하는 것
* 확률론 : 통계학이 데이터 퍼짐・불확실성에 대처하는 방법을 제공하는 동안 그 근거가 됨; 데이터 퍼짐・불확실성을 확률로 나타냄
2. 기술통계와 추론통계
1) 기술통계(descriptive statistics)
- 수집한 데이터를 정리・요약하는 방법
- 데이터의 특성・경향을 알 수 있음
- 확보한 데이터에만 집중, 데이터 자체의 성질을 이해함
2) 추론통계(inferential statistics)
- 수집한 데이터로부터 데이터의 발생원을 추정하는 방법
- 대상을 이해・미지의 데이터를 예측하기 위해 데이터 자체가 아니라 그 데이터의 발생원에 집중
[TIP] 추론통계의 방법들
- 확률 모형 : 데이터가 비교적 단순한 확률 장치에서 생성되었다고 가정하는 확률 장치
- 데이터와 확률 모형의 관계는 계산을 통해 분명하게 밝힐 수 있음
- 통계적 추론(statistical inference) : 데이터에서 가정한 확률 모형의 성질을 추정하는 방법
- 가설검정(statistical test) : 세운 가설・얻은 데이터가 얼마나 들어맞는지를 평가하여 가설을 채택할 것인지 판단하는 방법
3. 다양한 통계분석 방법
데이터 유형 ・ 변수의 개수 ・ 가정하는 확률 모형 ・ 데이터 분석 목적 등에 따라 통계분석 방법이 달라짐
cf) 질적 변수(범주형 변수) - 범주로 다뤄지는 변수(ex : 혈액형)
양적 변수(수치형 변수) - 수치로 다뤄지는 변수(ex : 키)
cf2) 변수의 개수는 '특정 속성에 관한 데이터의 모음'을 하나로 셈 (ex : 키 뿐인 데이터는 1변수, 키와 몸무게로 된 데이터는 2변수) → 2변수 이상의 데이터; 변수 사이의 관계에 주목
출처 : ⎡통계101 x 데이터 분석 (아베 마사토)⎦
'통계학 > 01. 통계학이란?' 카테고리의 다른 글
01-1 데이터를 분석하다 (0) | 2024.06.08 |
---|