(2) 빈도분석
- 빈도분석: 범주형 변수에 대한 빈도표를 작성하고 그에 적절한 그래프를 그리는 분석방법
- 빈도분석이 필요한 이유
1) 코딩 전 오류 값을 발견하기 위해 (데이터 노이즈)
- 데이터 노이즈 또는 입력 오류 값이 있는지 알아보기 위해 빈도분석을 실시한다. 예를 들어, 영화 제작 국가에 따른 한국 관관객 수의 차이를 분석한다고 가정해보자. 영화가 100개 있을 때, 그 중 한국 영화는 47개, 미국 영화는 29개, 영국영화는 21개, 일본영화, 인도영화, 중국영화는 각각 1개씩 있다면, 일본, 인도, 중국 영화는 아시아영화로 묶는 것이 개별적인 값으로 분석하는 것보다 더 좋은 값이 나올 수도 있다. 이런 것을 알아보기 위해 하는 것이 빈도분석이다.
2) 인구학적 문항
- 설문조사의 결과에 대해 분석하고자 할 때, 응답자들이 모집단과 유사하게 추출되었는지를 알기 위해 빈도분석을 실시한다. 빈도분석을 실시하면 설문 응답자들의 성별, 나이 등을 한 눈에 보기 좋다.
3) 본 문항
- 인구학적 문항뿐만 아니라 본 문항에서도 설문 결과의 응답 분포를 알아보기 위해 사용된다. 5점 척도로 설문조사를 했을 경우 점수의 평균으로 만족도를 평가하기도 하지만, 만족 혹은 불만족의 비율을 알기위해 빈도분석을 진행하기도 한다.
- 빈도분석 결과
- 통계량
- 백분위수 값(사분위수, N분위수, 백분위수)
- 산포도(표준편차, 분산, 범위, 최소값, 최대값, 평균의 표준오차)
- 중심경향(평균, 중위수, 최빈값, 합계)
- 분포(왜도, 첨도)
- 빈도표
- 평균
- 중위수
- 최빈값
- 합계
- 도표
- 막대도표
- 원도표
- 히스토그램
[참고]
- 한남대학교 통계학과 권세혁 교수님 Chapter5. 빈도 분석 강의자료
'데이터분석 및 데이터엔지니어 > 통계 및 분석 이론 정리' 카테고리의 다른 글
딥러닝 관련 이론 정리 - 인공지능 자격증 대비 관련 (0) | 2021.11.29 |
---|---|
기초통계정리 (1) 데이터와 통계학 (0) | 2019.11.18 |