본문 바로가기

통계/통계지식

[통계] p-value란 무엇인가? 짧고 굵은 기본개념!

 

 

p value란, 귀무가설이 맞다는 전제하에 통계값이 관측값 이상일 확률을 말한다.

 

가설검증이란 표본데이터의 평균이 전체 데이터의 평균을 잘 반영한다는 가정 하에 데이터의 평균을 구하는것이다. 아무리 무작위 추출을 잘 한다 하더라고 추출 평균은 전체 평균값과 멀어질 수 있다. 따라서 얼마나 다른가 를 알기위한 방법이 필요하며, 이 때문에 p value 가 필요하다.

 

예를들어 '모분포의 평균이 100이다' 라는 귀무가설을 세웠을때, 내가 구한 관측값인 95라는 값. 또는 그보다 큰 값이 나올 확률이 p value 이다. 만약 이 값이 매우 작다면 우리는 귀무가설을 기각시키고 대립가설을 채택할 수 있게 된다. 아주 작은 확률의 사건이 발생했다기 보다는 귀무가설이 틀렸다고 보기 때문이다.

 

정리하자면 p value는 귀무가설이 맞다는 전제하에 관측된 통계값(내가구한 95의 값) 또는 그 값보다 큰 값이 나올 확률이다.