통계란?
특정집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현이다.
통계자료의 획득 방법 4가지
1. 총 조사 / 전수조사(census)
- 대상 집단 모두를 조사하는데 많은 비용과 시간이 소요되므로
특별한 경우(ex. 인구주택 총 조사)를 제외하고는 사용되지 않는다.
2. 표본조사
- 모집단에서 샘플을 추출하여 진행하는 조사로, 대부분의 설문조사가 표본조사로 진행된다.
모집단의 정의, 표본의 크기, 조사방법, 조사기간, 표본추출방법을 정확히 명시해야 한다.
*모집단(population) : 조사하고자 하는 대상 집단 전체
*원소(element) : 모집단을 구성하는 개체
*표본(sample) : 조사하기 위해 추출한 모집단의 일부 원소
*모수(parameter) : 표본 관측에 의해 구하고자 하는 모집단에 대한 정보
3. 표본 추출 방법
- 표본조사의 중요한 점은 모집단을 대표할 수 있는 표본 추출이므로
표본 추출 방법에 따라 분석 결과의 해석은 큰 차이가 발생한다. (N개의 모집단에서 n개의 표본을 추출하는 경우)
가. 단순랜덤 추출법 (simple random sampling)
- 각 샘플에 번호를 부여하여 임이의 n개를 추출하는 방법으로, 각 샘플들은 선택될 확률이 동일하다.
(비복원, 복원 추출)
나. 계통추출법 (systematic sampling)
- 단순랜덤추출법의 변형된 방식으로 번호를 부여한 샘플을 나열하여 K개씩 n개의 구간으로 나누고 (K=N/n),
첫 구간에서 하나를 임의로 선택한 후에 K개씩 띄어 n개의 표본을 선택한다.
즉, 임의의 위치에서 매 k번째 항목을 추출하는 방법이다.
다. 집락추출법 (cluster random sampling)
- 군집을 구분하고 군집별로 단순랜덤 추출법을 수행한 후,
모든 자료를 활용하거나 샘플링하는 방법이다. (지역표본추추르 다단계표본추출)
라. 층화추출법 (stratified random sampling)
- 이질적인 원소들로 구성된 모집단에서 각 계층을 고루 대표할 수 있도록 표본을 추출하는 방법으로,
유사한 원소끼리 몇 개의 층(stratum)으로 나누어 각 층에서 랜덤추출하는 방법이다.
(비례충화추출법, 불비례충화추출법)
4. 측정(measurement)
가. 개요
- 표본 조사나 실험을 실시하는 과정에서 추출된 원소들이나 실험 단위로부터
주어진 목적에 적합하도록 관측해 자료를 얻는 것이다.
나. 측정방법
*질적 척도 (범주형자료, 숫자들의 크기 차이가 계산되지 않는 척도)
- 명목척도 : 측정 대상이 어느 집단에 속하는지 분류할때 사용 (등번호, 성별, 출생지 구분)
- 순서척도(서열척도) : 측정 대상의 서열관계를 관측하는 척도(순위, 만족도, 학년, 신용등급)
*양적척도 (수치형자료, 숫자들의 크기 차이를 계산할 수 있는 척도)
- 구간척도(등간척도) : 측정 대상이 갖고있는 속상의 양을 측정하는것으로
구간이나 구간 사이의 간격이 의미가 있는 자료(온도, 지수)
- 비율척도 : 간격(차이)에 대한 비울이 의미를 가지는 자료. 절대적 기준인 0이 존재하고
사칙연산이 가능하며 제일 많은 정보를 가지는 척도 (무게, 나이, 시간, 거리)
순서척도(서열척도)는 명목척도와 달리 매겨진 숫자의 크기를 의미있게 활용할 수 있다.
(ex. 1등이 2등보다 성적이 높다)
구간척도(등간척도)는 절대적 크기를 측정할 수 없기 때문에
사칙연산중 더하기,빼기는 가능하지만 비율처럼 곱하거나 나누는 것은 불가능하다.
'통계 > 통계지식' 카테고리의 다른 글
[통계] p-value란 무엇인가? 짧고 굵은 기본개념! (0) | 2021.01.04 |
---|---|
[모델성능 평가지표] (1) 회귀모델 (0) | 2020.11.05 |
[군집분석] K-중심군집(K-centroid clustering) : K-means clustering (0) | 2020.11.04 |
[군집분석] 군집분석이란? (군집분석 종류, 계층적군집화, 분할적군집화) (0) | 2020.11.04 |
[통계적 검정] 통계적 검정이란? (0) | 2020.11.04 |