본문 바로가기

알고싶은

R 프로그래밍, 등분산검정과 두 독립표본 t검증 방법(R에서 $ 뜻은?)

반응형

구글 파이썬 보다 쉬운 R 프로그래밍

등분산 검정과 t-test

R을 활용하여 등분산 검정과 두 독립 표본 t검증을 해보자. 아래에서 구글 파이썬보다 쉬운 r코드를 알아보자. 여기서 구글 파이썬은 구글의 코랩을 이야기하는 것이다. 구글에는 파이썬, 주피터 노트북을 대신해 설치 없이 실행할 수 있는 Colaboratory가 있다.

 

R을 활용하여 해결할 문제

성별이 폐활량에 통계적으로 유의미한 영향을 주는지 알아보자.
유의수준은=.05에서 두 독립 표본 t 검증하고 분석 결과를 작성하세요.

폐활량과 r
폐활량과 r

1. 문제 살펴보기

1) 유의수준 .05

의미 사실이 아닐 확률"이 5%라는 뜻으로, 사실일 확률이 95% 라는 뜻

2) t-test

두 독립 표본 t검정(검증)은 Two independent sample t-test 한다. 두 개의 독립변인(독립적인 집단) 간에 모평균이 다른지 알아보고자 할 때 사용한다.

 

t검정을 하기 전에는 먼저 2가지를 확인해야 한다. 정규성 가정과 등분산 가정을 알아야 두 독립 표본 t검증을 할 수 있다.

(1) 정규성 가정

두 집단의 분포가 정규분포를 따른다고 할 수 있는가?

성별에 따른 폐활량과 r
성별에 따른 페활량과 r

(2) 등분산 가정

두 집단의 분산이 같다고 할 수 있는가?(귀무가설을 기각하지 않으면 등분산성 가정 가능)

3) 귀무가설? 영가설? 대립 가설?

귀무가설 귀무가설은 기호로는 H0으로, 영어로 null hypothesis로 쓴다. 다른 말로 영가설이라고도 한다. 통계학에서는 처음부터 버릴 것으로 예상하는 가설이다. 차이가 없거나 의미 있는 차이가 없는 경우의 가설이다. 이것이 맞거나 맞지 않다는 통계학적 증거를 통해 증명하려는 가설이 귀무가설(영가설)이다.


대립 가설 기호로는 H1은 연구 가설 또는 유지 가설은 귀무가설에 대립하는 명제이다. 보통, 모집단에서 독립변수와 결과변수 사이에 어떤 특정한 관련이 있다는 꼴이다.

위 두 가지 가정(정규성 가정과 등산분 가정)이 성립하지 않는다면

윌콕슨 순위합 검정(Wilcoxon's rank sum test)

웰치의 t-검정(Welch's t-test)을 수행해야 한다.

2. R 프로그래밍 시작

폐활량에 통계적으로 유의미한 영향을 찾기 위해 데이터에서 성별을 찾는다.

R에서 등분산 검정을 하는 함수는 var.test( )

t-검정을 하는 함수는 t.test( )

R에서 $ 는 데이 프레임에서 칼럼을 가져오는 것

R에서 == 서로 같다는 의미

3. 해석

R 결과를 해석하자면 아래와 같다.

등분산 검정을 한 결과 p-value = 0.3892로 0.05보다 크기 때문에 등분산 가정을 만족한다고 할 수 있다.

다음 두 독립 표본 t 검증 결과 p-value = 4.262e-06이다. e-06은 10에 마이너스 6승이라는 의미로 p 값이 0.00000462로 0.05보다 아주 작으며 두 집단의 평균은 다르다고 할 수 있다.

4. 결론

따라서 성별은 폐활량에 영향을 준다.

반응형