p value란, 귀무가설이 맞다는 전제하에 통계값이 관측값 이상일 확률을 말한다.
가설검증이란 표본데이터의 평균이 전체 데이터의 평균을 잘 반영한다는 가정 하에 데이터의 평균을 구하는것이다. 아무리 무작위 추출을 잘 한다 하더라고 추출 평균은 전체 평균값과 멀어질 수 있다. 따라서 얼마나 다른가 를 알기위한 방법이 필요하며, 이 때문에 p value 가 필요하다.
예를들어 '모분포의 평균이 100이다' 라는 귀무가설을 세웠을때, 내가 구한 관측값인 95라는 값. 또는 그보다 큰 값이 나올 확률이 p value 이다. 만약 이 값이 매우 작다면 우리는 귀무가설을 기각시키고 대립가설을 채택할 수 있게 된다. 아주 작은 확률의 사건이 발생했다기 보다는 귀무가설이 틀렸다고 보기 때문이다.
정리하자면 p value는 귀무가설이 맞다는 전제하에 관측된 통계값(내가구한 95의 값) 또는 그 값보다 큰 값이 나올 확률이다.
'통계 > 통계지식' 카테고리의 다른 글
[통계] 정의역이란, 공역이란, 치역이란? 쉽게 알아보기! (1) | 2021.01.11 |
---|---|
[통계] 상관계수란? 결정계수란? 또 수정결정계수란? (0) | 2021.01.06 |
[모델성능 평가지표] (1) 회귀모델 (0) | 2020.11.05 |
[군집분석] K-중심군집(K-centroid clustering) : K-means clustering (0) | 2020.11.04 |
[군집분석] 군집분석이란? (군집분석 종류, 계층적군집화, 분할적군집화) (0) | 2020.11.04 |