[통계] 통계란? (개념, 표본추출방법, 명목척도,순서척도,구간척도,비율척도)

2020. 11. 3. 18:25·통계/통계지식

통계란?

특정집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현이다.

 

 

통계자료의 획득 방법 4가지

1. 총 조사 / 전수조사(census)

- 대상 집단 모두를 조사하는데 많은 비용과 시간이 소요되므로

특별한 경우(ex. 인구주택 총 조사)를 제외하고는 사용되지 않는다.

 

2. 표본조사 

- 모집단에서 샘플을 추출하여 진행하는 조사로, 대부분의 설문조사가 표본조사로 진행된다. 

모집단의 정의, 표본의 크기, 조사방법, 조사기간, 표본추출방법을 정확히 명시해야 한다.

 

*모집단(population) : 조사하고자 하는 대상 집단 전체

*원소(element) : 모집단을 구성하는 개체

*표본(sample) :  조사하기 위해 추출한 모집단의 일부 원소

*모수(parameter) : 표본 관측에 의해 구하고자 하는 모집단에 대한 정보

 

 

 

3. 표본 추출 방법 

- 표본조사의 중요한 점은 모집단을 대표할 수 있는 표본 추출이므로

표본 추출 방법에 따라 분석 결과의 해석은 큰 차이가 발생한다. (N개의 모집단에서 n개의 표본을 추출하는 경우)

 

가. 단순랜덤 추출법 (simple random sampling)

- 각 샘플에 번호를 부여하여 임이의 n개를 추출하는 방법으로, 각 샘플들은 선택될 확률이 동일하다.

(비복원, 복원 추출)

단순랜덤 추출법

 

나. 계통추출법 (systematic sampling)

- 단순랜덤추출법의 변형된 방식으로 번호를 부여한 샘플을 나열하여 K개씩 n개의 구간으로 나누고 (K=N/n),

첫 구간에서 하나를 임의로 선택한 후에 K개씩 띄어 n개의 표본을 선택한다.

즉, 임의의 위치에서 매 k번째 항목을 추출하는 방법이다.

계통추출법

 

 

다. 집락추출법 (cluster random sampling)

- 군집을 구분하고 군집별로 단순랜덤 추출법을 수행한 후,

모든 자료를 활용하거나 샘플링하는 방법이다. (지역표본추추르 다단계표본추출)

집략추출법

라. 층화추출법 (stratified random sampling)

- 이질적인 원소들로 구성된 모집단에서 각 계층을 고루 대표할 수 있도록 표본을 추출하는 방법으로,

유사한 원소끼리 몇 개의 층(stratum)으로 나누어 각 층에서  랜덤추출하는 방법이다.

(비례충화추출법, 불비례충화추출법)

4. 측정(measurement) 

가. 개요

- 표본 조사나 실험을 실시하는 과정에서 추출된 원소들이나 실험 단위로부터

주어진 목적에 적합하도록 관측해 자료를 얻는 것이다.

 

 

나. 측정방법

 

*질적 척도 (범주형자료, 숫자들의 크기 차이가 계산되지 않는 척도)

- 명목척도 : 측정 대상이 어느 집단에 속하는지 분류할때 사용 (등번호, 성별, 출생지 구분)

- 순서척도(서열척도) : 측정 대상의 서열관계를 관측하는 척도(순위, 만족도, 학년, 신용등급)

 

*양적척도 (수치형자료, 숫자들의 크기 차이를 계산할 수 있는 척도)

- 구간척도(등간척도) : 측정 대상이 갖고있는 속상의 양을 측정하는것으로

	     	     구간이나 구간 사이의 간격이 의미가 있는 자료(온도, 지수)

- 비율척도 : 간격(차이)에 대한 비울이 의미를 가지는 자료. 절대적 기준인 0이 존재하고 

            사칙연산이 가능하며 제일 많은 정보를 가지는 척도 (무게, 나이, 시간, 거리)

 

 

쉽게 이해하는 그림!

 

순서척도(서열척도)는 명목척도와 달리 매겨진 숫자의 크기를 의미있게 활용할 수 있다.

(ex. 1등이 2등보다 성적이 높다)

 

구간척도(등간척도)는 절대적 크기를 측정할 수 없기 때문에

사칙연산중 더하기,빼기는 가능하지만 비율처럼 곱하거나 나누는 것은 불가능하다.

 

 

 

 

 

'통계 > 통계지식' 카테고리의 다른 글

[통계] p-value란 무엇인가? 짧고 굵은 기본개념!  (0) 2021.01.04
[모델성능 평가지표] (1) 회귀모델  (0) 2020.11.05
[군집분석] K-중심군집(K-centroid clustering) : K-means clustering  (0) 2020.11.04
[군집분석] 군집분석이란? (군집분석 종류, 계층적군집화, 분할적군집화)  (0) 2020.11.04
[통계적 검정] 통계적 검정이란?  (0) 2020.11.04
'통계/통계지식' 카테고리의 다른 글
  • [모델성능 평가지표] (1) 회귀모델
  • [군집분석] K-중심군집(K-centroid clustering) : K-means clustering
  • [군집분석] 군집분석이란? (군집분석 종류, 계층적군집화, 분할적군집화)
  • [통계적 검정] 통계적 검정이란?
정많이 정만이
정많이 정만이
jeongmany
  • 정많이 정만이
    정많이 정만이
    정많이 정만이
  • 전체
    오늘
    어제
    • 분류 전체보기 (80)
      • 과거의 이력 (71)
        • CS (12)
        • 프론트엔드 (4)
        • javascript (21)
        • Vue.js (7)
        • bootstrap (1)
        • [그리드] ag-grid (3)
        • [그리드] vue-grid-layout (1)
        • HTML_CSS (5)
        • NPM (1)
        • [차트]highcharts (0)
        • JAVA (9)
        • 백엔드 (1)
        • 기본개념 (손필기) (5)
        • 프로그래머스 (1)
      • 알고리즘 (6)
      • 통계 (9)
        • 통계지식 (8)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    Webpack
    ag-grid
    반복문
    ubuntu설치
    JavaScript
    공유메모리
    코딩테스트
    ES6
    VirtualBox
    버추얼박스
    HTML
    js map
    java
    aggrid
    ubuntu
    js
    cs
    vue.js
    bootstrap
    vue
    webpack.config.js
    자바스크립트
    CSS
    개발자
    우분투
    알고리즘
    vuejs
    vue.config.js
    객체
    selectbox
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
정많이 정만이
[통계] 통계란? (개념, 표본추출방법, 명목척도,순서척도,구간척도,비율척도)
상단으로

티스토리툴바