> if 실험 조건이 세 가지이고, 모든 그룹 쌍에 대해 각각 t 검정을 수행한다면, 총 3번의 검정이 필요하다.
> 세 t 검정 모두 .05 수준으로 유의성을 판정한다고 하면, 각 검정에서 제1종 오류를 범하지 않을 확률은 .95이다.
> 만일 세 검정이 독립이라고 하면 제1종 오류를 범하지 않을 전체 확률은 .95^3 ==.857 이다.
> 이 결과로 제1종 오류를 범할 확률은 5% 에서 14.3%로 증가했다.
F는 모형과 오차의 비
즉, 분산분석은 어떤 그룹이 영향을 받았는지에 대한 구체적인 정보를 제공하지 않는다.
관측된 각 자료점과 총평균의 차이를 계산하고 그 차이들을 제곱해서 모두 합한 것
\(SS_T = \sum_{i=1}^{N}{(x_i - \bar{x_총}^2)}\)
분산과 제곱합의 관계가 \(s^2 = \frac{SS}{N-1}\) 이므로 \(SS = s^2(N-1)\) 이다.
\(SS_M\) = Y의 평균과 모형(그룹 평균)의 차이들을 사용
과정
\[SS_M = \sum_{n=1}^{k}{(\bar{x}_k - \bar{x}_총)^2}\]
모형이 설명하는 변동과 비체계적 요인들이 설명하는 변동의 비
\(F = \frac{MS_M}{MS_R}\)
\(MS_R > MS_M\) 이는 곧 비체계적 변동이 체계적 변동보다 많다는 뜻이기 때문
확신을 가지려면 관측된 F비를 그룹 평균들이 같을 전적으로 우연히 얻을 수 있는 최대 F비와 비교해 봐야 한다.
t 검정에서처럼, 분산분석은 그룹 분산들이 같다고 가정 -> 이 가정은 레빈 검정으로 검사할 수 있다.
이 레빈 검정은 관측값과 그 관측값이 속한 표본의 평균 또는 중앙값의 차이의 절댓값에 대한 분산분석 검정이다.
If 레빈 검정의 결과가 유희하다면 분산들이 유의하게 서로 다르다고 말할 수 있으며, 분산분석의 여러 가정 중 하나가 깨진 것이므로
문제를 해결한 후 분석을 진행해야 한다.
한 대비에서 오직 두 개의 변동 조각만 비교해야 한다는 점과, 한 비교에서 특정하게 선택된 그룹은 이후의 대비에서 사용하지 말아야 한다
한 변동 조각에는 양의 가중치를, 다른 변동 조각에는 음의 가중치를 배정해야 한다.
한 대비에서 비교하는 모든 그룹의 가중치를 합하면 0이 되어야 한다.
가중치가 0인 그룹은 모든 계산에서 제외된다.
Discovering Statistics Using R - 010 [ 2024년12월25일 ]
Discovering Statistics Using R - 009 [ 2024년12월12일 ]
Discovering Statistics Using R - 008 [ 2024년12월10일 ]
Discovering Statistics Using R - 007 [ 2024년12월06일 ]
Discovering Statistics Using R - 006 [ 2024년12월05일 ]
Discovering Statistics Using R - 005 [ 2024년12월04일 ]
Discovering Statistics Using R - 004 [ 2024년12월03일 ]
Discovering Statistics Using R - 003 [ 2024년11월30일 ]