본문 바로가기

데이터분석 및 데이터엔지니어/통계 및 분석 이론 정리2

기초통계정리 (2) 빈도분석 (2) 빈도분석 - 빈도분석: 범주형 변수에 대한 빈도표를 작성하고 그에 적절한 그래프를 그리는 분석방법 - 빈도분석이 필요한 이유 1) 코딩 전 오류 값을 발견하기 위해 (데이터 노이즈) 데이터 노이즈 또는 입력 오류 값이 있는지 알아보기 위해 빈도분석을 실시한다. 예를 들어, 영화 제작 국가에 따른 한국 관관객 수의 차이를 분석한다고 가정해보자. 영화가 100개 있을 때, 그 중 한국 영화는 47개, 미국 영화는 29개, 영국영화는 21개, 일본영화, 인도영화, 중국영화는 각각 1개씩 있다면, 일본, 인도, 중국 영화는 아시아영화로 묶는 것이 개별적인 값으로 분석하는 것보다 더 좋은 값이 나올 수도 있다. 이런 것을 알아보기 위해 하는 것이 빈도분석이다. 2) 인구학적 문항 설문조사의 결과에 대해 분.. 2019. 11. 18.
기초통계정리 (1) 데이터와 통계학 데이터 분석을 공부하기 앞서 기초통계를 정리해볼까합니다. 기초통계정리 순서는 다음과 같습니다. (1) 데이터와 통계학 (2) 빈도분석 (3) 교차분석 (4) 카이제곱 검정 (5) 가설검정 (6) 일표본 T검정(1-sample) (7) 독립표본 T검정(2-sample) (8) 대응표본 T검정 (9) 상관분석 (10) 분산분석 (11) 회귀분석 *** (1) 데이터와 통계학 - 데이터는 척도에 의한 분류와 인과관계에 따른 분류로 나눌 수 있음 1) 척도에 의한 분류 데이터는 정성적 데이터와 정량적 데이터로 나뉨 정성적 데이터는 범주형 데이터를 말하며, 정량적 데이터는 연속형 데이터를 말함 정성적 데이터는 명목척도와 서열척도로 나눌 수 있음 명목척도: 상호 배타적인 범주로 수치를 부여한 척도 (예: 여자-0,.. 2019. 11. 18.