본문 바로가기

Study history/ADP 기출문제 풀이6

ADP 기출문제 풀이) 구매 데이터 군집분석 문제 w/Python 이번 포스팅에서는 지난 26회 ADP 실기에서 출제되었던 문제를 풀어본다. 실제로 내가 합격했던 회차라서 반가운 문제이기도 하다. 이 때 해당 문제로 50점 만점에 41점을 맞았었다. 분명 9점이 날아간 이유가 있을 것이고, 부족한 풀이이지만 아래와 같이 기억을 되살려 풀이를 포스팅해 본다. 9. 구매 데이터 군집분석 문제 (ADP 실기 26회) nvoiceNo: Invoice number. Nominal, a 6-digit integral number uniquely assigned to each transaction. If this code starts with letter ‘c’, it indicates a cancellation. StockCode: Product (item) code. Nomin.. 2023. 8. 30.
ADP 기출문제 풀이) 추정과 가설검정 문제들 w/Python 예전 다른 포스팅에서도 언급한 적 있듯이 ADP는 통계와 머신러닝을 아우르는 시험이다. 그렇기 때문에 통계 관련 문제도 항상 출제가 되고 있다. 이번 포스팅에서는 ADP 실기 기출문제들에서 출제되었던 추정과 가설 검정 문제들을 풀어보려고 한다. 7. 일표본 추정 문제 # 7-1. 12건의 광고 시간 측정. 평균 15.5초, 분산 3.2초 일때 모평균의 90% 신뢰구간을 추정하시오. [출처: ADP 27회 실기 기출 (https://www.datamanim.com/dataset/ADPpb/00/27.html)] 모분산을 모르는 경우 모평균의 신뢰구간을 추정하는 문제이다. t분포를 사용해서 문제를 푼다. # 7-2. 철강제품의 불량률이 0.9인 경우, 오차의 한계가 5%가 되도록하는 최소 표본 사이즈는? [.. 2023. 8. 29.
ADP 기출문제 풀이) 대구 임대 아파트 데이터 분석 문제 w/Python 이번 포스팅에서는 가장 최근에 ADP 실기 시험에서 출제된 대구 임대 아파트 데이터 분석 문제를 포스팅해보기로 한다. 기출문제 풀이 상 오류가 있을 수 있기 때문에 그 부분 감안해 주시기를 바라며, 기출문제 풀이 4번째 포스팅 시작^^ 6. 대구 임대 아파트 데이터 (ADP 실기 29회) features: 임대 아파트 관련 특징들 (순번, 계약구분, 거주개월 ... 등 22개) target: 재계약횟수 [출처] https://www.data.go.kr/data/15094266/fileData.do # 6-1. 데이터 전처리 하시오 (결측치, 이상치 처리) 결측치의 경우, 퇴거연도 변수가 전체 데이터 수 대비 3/4의 결측치를 가지고 있는 것으로 나타났다. 퇴거연도가 결측치로 나타난 이유는 계약구분 상 유.. 2023. 8. 28.
ADP 기출문제 풀이) 다중선형회귀, 베이지안 회귀 문제 w/Python ADP 실기 기출문제 풀이 세번째 포스팅의 내용은 베이지안 회귀와 2차 교호작용항을 고려한 다중선형회귀 문제이다. 대부분의 회귀 문제는 오차제곱합을 최소화하는 방식으로 회귀식을 찾아갔는데, 베이지안 회귀 문제가 나와서 '이런 것도 있어?' 하고 당황했던 기억이 난다. 통계와 머신러닝은 공부할 수록 모르는 것이 화수분처럼 나오는 그런 학문이다^^ 여튼, 이번 포스팅에서는 ADP 실기 17회와 26회에서 나왔던 문제들을 풀어보았다. 만점짜리 풀이는 아니기 때문에 참고로 해주시길 바라며... 4. 부동산 가격 예측 데이터 (ADP 실기 17회) Id: id LotArea: Lot size in square feet LotFrontage: Linear feet of street connected to prope.. 2023. 8. 25.
ADP 기출문제 풀이) 데이터 전처리 관련 문제들 w/Python 나의 풀이가 만점짜리 풀이가 아닐지라도 누군가에게는 참고와 도움이 되기를 바라면서^^ (내용 상 오류나 질문들은 댓글로 달아주시면 대환영입니다) ADP 실기 기출문제 풀이 두번째 포스팅 시작 ! 3. 매출액 예측 데이터 (ADP 실기 24회) features: 광고횟수, 광고비 target: 매출액 [출처] https://www.datamanim.com/dataset/ADPpb/00/24.html # 3-1. 광고비 변수를 가변수 처리후 다중회귀를 수행하여 회귀계수가 유의한지 검정하시오. 범주형 변수인 광고비를 get_dummies로 더미코딩 하는 전처리를 진행하였다. 범주의 수준보다 1개의 개수가 적은 가변수를 생성함으로써 다중공선성을 피할 수 있다. 회귀계수의 유의성을 위해 회귀계수가 0인지 0이 아.. 2023. 8. 24.