파이썬) 아노바 테이블에서 자유도 계산하는 방법 (+일원분산분석, 이원분산분석의 경우)

Python notes/Statistical Analysis

성실한 나무 2021. 6. 24. 16:40

#1. 일원분산분석 아노바 테이블 자유도:

목화 함유량 15, 20, 25, 30, 35 5개 수준에 따라서 각각 5개의 섬유장력 값을 가진 데이터(전체 데이터 수는 25개)로

일원분산분석 아노바 테이블을 만들어보았다.

여기서 독립변수 목화함유량의 df 4, 자유도 4는 전체 수준 (15, 20, 25, 30, 35) 5개에서 1개를 뺀 값이다. ("1개 빼는 것은 항상 고정")

또한, Residual의 df 20은 전체데이터 수 25개에서 목화함유량의 자유도 4를 빼고 거기서 1개를 더 뺀 값이다.

#2. 이원분산분석 아노바 테이블 자유도:

전공 (전공1, 전공2, 전공3) 3개 수준과 성별(남, 여) 2개 수준에 따라 각각 2개의 점수 값을 가진 데이터(전체 데이터수는 12개)로

이원분산분석 아노바 테이블을 만들어보았다.

여기서 독립변수1 전공의 df 2, 자유도 2는 전체 수준 (전공1, 전공2, 전공3) 3개에서 1개를 뺀 값이다.

또한, 독립변수2 성별의 df 1, 자유도 1은 전체 수준(남, 여) 2개에서 1개를 뺀 값이다.

또한, 교호작용 확인을 위한 전공:성별의 df는 전공df * 성별 df로 2*1= 2이다. (***여기서는 1을 빼지 않는다)

마지막으로, Residual의 df 6은 전체데이터 수 12개에서 전공의 df 2 - 성별 df 1 - 전공:성별 df 2 - 고정된 빼기 1 한 값이다.

#3. 결론: 각 독립변수들과 Residual의 df를 구할 때 고정된 빼기 1을 항상 기억해야 한다.