
분산분석의 개념
두 개 이상의 평균(보통 3개 이상)을 동시에 비교하고자 할 때 분산분석 analysis of variance, ANOVA 을 이용한다.
분산분석을 위한 세가지 가정
1. 독립성 : 종속변수에 대한 각 표본의 관측치는 독립적이다.
2. 정규성 : 모집단들은 모두 정규분포를 따른다.
3. 등분산성 : 모집단들은 모두 동일한 분산을 가지고 있다.
일원분산분석 one way ANOVA
종속변수 평균 차이에 대한 단일요인 독립변수에 의한 분산분석 검정 방식
총편차 = 집단간 편차 + 집단내 편차
편차 : 평균과 관측치의 차이
0 가설 H0 : 기각시키고 싶은 가설
1 가설 H1 : 내가 주장하고 싶은 가설. 대립가설
총변동 SST = 집단간 변동 SSB + 집단내 변동 SSW
(between, within)
집단간 평균제곱 MSB mean square between samples = SSB / (k-1)
집단내 평균제곱 MSW mean square within samples = SSW / (n-k)
일원분산분석의 F통계량
F통계량 = MSB / MSW = [ SSB / (k-1) ] / [ SSW / (n-k) ]
F통계량은 높을수록 좋다.
F통계량이 크다 = 집단간편차가 크다 = 집단간 구분이 명확하다
= 집단내 편차가 작다 = 집단 구분이 쉽다 = 설명력이 높다
귀무가설의 기각여부 결정
해당 자유도 쌍에 따라 분포가 결정되고 유의수준에 따라 기각역이 설정된다.
이원분산분석 two way ANOVA
종속변수의 평균 차이에 대한 두 개의 독립변수에 의한 분산분석 검정방식
- 주효과 : 독립변수 두 개가 종속변수에 각각 따로 영향을 미침
- 상호작용 효과 : 독립변수 두 개가 서로 영향을 미치면서 종속변수에 영향을 줌
상호작용 효과가 없는 이원분산분석
총변동 = x1의 집단간변동 + x2의 집단간 변동 + 집단내변동
'ADsP' 카테고리의 다른 글
ADsP 시계열분석과 차원축소 (0) | 2021.05.05 |
---|---|
ADsP 회귀분석 (0) | 2021.05.04 |
ADsP 확률 및 확률분포 (0) | 2021.05.02 |
ADsP 통계분석 (0) | 2021.05.02 |
ADsP 통계분석 추정과 가설검정 (0) | 2021.05.01 |