본문 바로가기
데이터분석 및 데이터엔지니어/통계 및 분석 이론 정리

기초통계정리 (2) 빈도분석

by na.__.na 2019. 11. 18.

(2) 빈도분석

 

- 빈도분석: 범주형 변수에 대한 빈도표를 작성하고 그에 적절한 그래프를 그리는 분석방법

 

- 빈도분석이 필요한 이유

 

1) 코딩 전 오류 값을 발견하기 위해 (데이터 노이즈)

  • 데이터 노이즈 또는 입력 오류 값이 있는지 알아보기 위해 빈도분석을 실시한다. 예를 들어, 영화 제작 국가에 따른 한국 관관객 수의 차이를 분석한다고 가정해보자. 영화가 100개 있을 때, 그 중 한국 영화는 47, 미국 영화는 29, 영국영화는 21, 일본영화, 인도영화, 중국영화는 각각 1개씩 있다면, 일본, 인도, 중국 영화는 아시아영화로 묶는 것이 개별적인 값으로 분석하는 것보다 더 좋은 값이 나올 수도 있다. 이런 것을 알아보기 위해 하는 것이 빈도분석이다.

 

2) 인구학적 문항

  • 설문조사의 결과에 대해 분석하고자 할 때, 응답자들이 모집단과 유사하게 추출되었는지를 알기 위해 빈도분석을 실시한다. 빈도분석을 실시하면 설문 응답자들의 성별, 나이 등을 한 눈에 보기 좋다.

 

3) 본 문항

  • 인구학적 문항뿐만 아니라 본 문항에서도 설문 결과의 응답 분포를 알아보기 위해 사용된다. 5점 척도로 설문조사를 했을 경우 점수의 평균으로 만족도를 평가하기도 하지만, 만족 혹은 불만족의 비율을 알기위해 빈도분석을 진행하기도 한다.

 

- 빈도분석 결과

 

  • 통계량
    • 백분위수 값(사분위수, N분위수, 백분위수)
    • 산포도(표준편차, 분산, 범위, 최소값, 최대값, 평균의 표준오차)
    • 중심경향(평균, 중위수, 최빈값, 합계)
    • 분포(왜도, 첨도)
  • 빈도표
    • 평균
    • 중위수
    • 최빈값
    • 합계
  • 도표
    • 막대도표
    • 원도표
    • 히스토그램

 

[참고]

  • 한남대학교 통계학과 권세혁 교수님 Chapter5. 빈도 분석 강의자료