2021년 12월 4일에 예정된 제3회 빅데이터분석기사 실기를 대비하여 첫 시험이었던 2회 문제를 복원해봅니다.
1. 빅데이터분석기사 실기 정보
문제유형
유형 | 문항수 | 문항당 배점 | 총점 | 배정시간 | |
단답형 | 10개 | 3점 | 30점 | 180분 | |
작업형 | 제1유형 | 3개 | 10점 | 30점 | |
제2유형 | 1개 | 40점 | 40점 | ||
합계 | 14개 문항 | 100점 | 180분 |
시험 시간은 총 3시간이며, 단단형 10문제, 작업형 1유형 3문제, 2유형 1문제가 출시됩니다
단답형은 필기 수준의 이론을 객관식이 아닌 주관식으로 적는 형태인거 같고
작업형 1유형은 간단하게 코드를 물어보는 형태이며,
2유형은 데이터 분석을 하는 식인거 같습니다.
지난 시험을 보니 2유형이 0점 또는 40점인 경우가 많았다고 합니다
그렇게 어려운 수준은 아니며 평소에 데이터분석을 해본 사람이라면 충분히 풀 수 있는 거 같습니다
그러나 모든 함수를 외워야하니 그게 참 어려운거같습니다
저도 구글형 인간이자 영어 바보라 스펠링 외우는게 참 낯설더군요 ...
그땐 help() 함수를 쓰면 도움이 된다고 합니다 !
help 써본 적이 거의 없는데 남은 일주일간 인터넷 연결없이 데이터분석하는 연습을 해봐야겠습니다.
사용할 수 있는 언어는 R과 파이썬 2개이며, 지난 시험 기준 파이썬을 선택한 사람이 40점을 받는 비율이 높았다고 하네요
플랫폼은 클라우드 기반 코딩 플랫폼이며, 아나콘다 쥬피터를 평소에 사용하던 사람들은 당황한다고 하니 이것도 미리 연습이 필요할 것 같아요
후기에 따르면 프로그래머스랑도 다르다고 ...
2. 빅데이터분석기사 실기 2회 문제 복원
(1) 단답형
데이터 전처리 단계에서 발견하는 값으로 기존 값들과 상이한 값은 무엇인가?
답 : 이상치
결측값을 대치 하는 방법 중 평균값을 사용해 대치하는 방법은 무엇인가?
답 : 평균대치법
기계학습의 일종으로 정답지와 label이 없으며, 군집분석과 인공신경망이 포함되는 이 기법은 무엇인가?
답 : 비지도학습
모델 학습시 잘못된 결과에 대해 가중치를 반영해 모델을 생성하는 방법은 무엇인가?
답 : 부스팅
모델 생성 시, 모델의 파라미터값을 측정하기 위해 사용되며, 사용자에 의해 결정되는 것은 무엇인가?
답 : 하이퍼파라미터
앙상블 기법 중 부스팅 종류 중 약학습기는 무엇인가?
답 : Gradient boosting
모델의 학습에서는 정확도가 높게 나오지만 테스트 셋에서는 정확도가 낮게 나오는 것을 무엇은 무엇인가?
답 : 오버피팅
마지막 은닉층2개의 값 [02, -03] , 가중치 [03, 0.1] , bias -0.05, 출력층 1개
f(x) = x , if x >= 0 , 그외 -1 일 때
답 : -1
변수 선택 방법 중 모든 변수를 활용해 하나씩 제거해 가는 방법은 무엇인가?
답 : 후진제거법
TPR , FPR 로 그려서 확인하는 곡선은 무엇인가?
답 : roc-curve
(문제는 복원된 문제를 보고 제가 약간 수정하여 적었습니다. 답은 맞으나 문제는 다를 수 있습니다)
(2) 작업형 1
문제 1 : 주어진 데이터셋의 컬럼1에서 상위 10개의 데이터에 대하여 10개 중 최솟값으로 대체한 후, 컬럼2에서 값이 80 이상인 데이터들 중 컬럼1의 평균값을 구하시오
데이터 : 보스턴 데이터 범죄율
정답 : 5.759387
문제 2 : 주어진 데이터셋 중 앞에서부터 80% 데이터를 샘플링하여 특정 컬럼의 표준편차를 구하고, 해당 컬럼에서 결측치를 중앙값으로 대체한 후 표준편차를 구하여 그 두가지 표준편차의 차이 구하시오
데이터 : 캐글 캘리포니아 주택 데이터 세트
정답 : 1.975147
문제 3 : 주어진 데이터셋에서 특정 컬럼의 이상치를 IQR rule에 의해 탐지하고 이상치들의 합을 구하시오
(3) 작업형 2
문제 : 고객 구매 데이터를 사용해서 고객이 주문한 물품이 제 시간에 도착 여부 예측 (지연될 확률)
데이터 : https://www.kaggle.com/prachi13/customer-analytics?select=Train.csv
데이터 칼럼 : 운송수단, 창고 종류, 택배 회사와의 연락 여부, 이전에 택배를 주문한 적이 있었는지 여부, 금액 할인을 얼마나 받았는지 등
평가방식 : ROC-AUC
[참고자료 및 출처]
'자격증' 카테고리의 다른 글
빅데이터분석기사 실기 시험일/시험시간/문제유형/시험대비 (0) | 2023.11.22 |
---|---|
[빅데이터분석기사 실기 대비] 홈페이지 공식 예제 문제 풀이 (초보자 관점 쉬운 풀이) (0) | 2021.12.04 |