본문 바로가기

통계/통계지식

[통계] 통계란? (개념, 표본추출방법, 명목척도,순서척도,구간척도,비율척도)

통계란?

특정집단을 대상으로 수행한 조사실험을 통해 나온 결과에 대한 요약된 형태의 표현이다.

 

 

통계자료의 획득 방법 4가지

1. 총 조사 / 전수조사(census)

- 대상 집단 모두를 조사하는데 많은 비용과 시간이 소요되므로

특별한 경우(ex. 인구주택 총 조사)를 제외하고는 사용되지 않는다.

 

2. 표본조사 

- 모집단에서 샘플을 추출하여 진행하는 조사로, 대부분의 설문조사가 표본조사로 진행된다. 

모집단의 정의, 표본의 크기, 조사방법, 조사기간, 표본추출방법을 정확히 명시해야 한다.

 

*모집단(population) : 조사하고자 하는 대상 집단 전체

*원소(element) : 모집단을 구성하는 개체

*표본(sample) :  조사하기 위해 추출한 모집단의 일부 원소

*모수(parameter) : 표본 관측에 의해 구하고자 하는 모집단에 대한 정보

 

 

 

3. 표본 추출 방법 

- 표본조사의 중요한 점은 모집단을 대표할 수 있는 표본 추출이므로

표본 추출 방법에 따라 분석 결과의 해석은 큰 차이가 발생한다. (N개의 모집단에서 n개의 표본을 추출하는 경우)

 

가. 단순랜덤 추출법 (simple random sampling)

- 각 샘플에 번호를 부여하여 임이의 n개를 추출하는 방법으로, 각 샘플들은 선택될 확률이 동일하다.

(비복원, 복원 추출)

단순랜덤 추출법

 

나. 계통추출법 (systematic sampling)

- 단순랜덤추출법의 변형된 방식으로 번호를 부여한 샘플을 나열하여 K개씩 n개의 구간으로 나누고 (K=N/n),

첫 구간에서 하나를 임의로 선택한 후에 K개씩 띄어 n개의 표본을 선택한다.

즉, 임의의 위치에서 매 k번째 항목을 추출하는 방법이다.

계통추출법

 

 

다. 집락추출법 (cluster random sampling)

- 군집을 구분하고 군집별로 단순랜덤 추출법을 수행한 후,

모든 자료를 활용하거나 샘플링하는 방법이다. (지역표본추추르 다단계표본추출)

집략추출법

라. 층화추출법 (stratified random sampling)

- 이질적인 원소들로 구성된 모집단에서 각 계층을 고루 대표할 수 있도록 표본을 추출하는 방법으로,

유사한 원소끼리 몇 개의 층(stratum)으로 나누어 각 층에서  랜덤추출하는 방법이다.

(비례충화추출법, 불비례충화추출법)

4. 측정(measurement) 

가. 개요

- 표본 조사나 실험을 실시하는 과정에서 추출된 원소들이나 실험 단위로부터

주어진 목적에 적합하도록 관측해 자료를 얻는 것이다.

 

 

나. 측정방법

 

*질적 척도 (범주형자료, 숫자들의 크기 차이가 계산되지 않는 척도)

- 명목척도 : 측정 대상이 어느 집단에 속하는지 분류할때 사용 (등번호, 성별, 출생지 구분)

- 순서척도(서열척도) : 측정 대상의 서열관계를 관측하는 척도(순위, 만족도, 학년, 신용등급)

 

*양적척도 (수치형자료, 숫자들의 크기 차이를 계산할 수 있는 척도)

- 구간척도(등간척도) : 측정 대상이 갖고있는 속상의 양을 측정하는것으로

	     	     구간이나 구간 사이의 간격이 의미가 있는 자료(온도, 지수)

- 비율척도 : 간격(차이)에 대한 비울이 의미를 가지는 자료. 절대적 기준인 0이 존재하고 

            사칙연산이 가능하며 제일 많은 정보를 가지는 척도 (무게, 나이, 시간, 거리)

 

 

쉽게 이해하는 그림!

 

순서척도(서열척도) 명목척도와 달리 매겨진 숫자의 크기를 의미있게 활용할 수 있다.

(ex. 1등이 2등보다 성적이 높다)

 

구간척도(등간척도)는 절대적 크기를 측정할 수 없기 때문에

사칙연산중 더하기,빼기는 가능하지만 비율처럼 곱하거나 나누는 것은 불가능하다.