본문 바로가기

Study history/ADP 실기 합격 기록25

ADP) 1-3-1. 탐색적 자료 분석: 요약, 기술통계 (평균, 표준편차, 중위수, 사분위수, 변동계수, 최빈값, 그래프, 왜도, 첨도), 줄기잎그림, 도넛차트, 히스토그램, 상자수염 그림 파이썬으로 탐색적 자료 분석 (EDA) 하기 탐색적 분석은 다양한 차원과 값을 조합해가며 특이점이나 유의미한 사실을 도출하고 분석의 최종 목적을 달성해가는 과정으로서 데이터의 특징과 내재하는 구조적 관계를 알아내기 위한 기법들의 통칭이다. 프린스톤 대학의 Tukey 교수가 1977년 저서를 발표함으로써 EDA가 등장한다. EDA의 4가지 주제는 저항성의 강조, 잔차계산, 자료변수의 재표현, 그래프를 통한 현시성이다. EDA는 데이터이해 단계에서 변수의 분포와 특성을 파악하고, 변수 생성 단계에서 분석목적에 맞는 주요한 요약 및 파생변수 생성하며, 변수 선택 단계에서 목적변수에 의미있는 후보 변수를 선택하기 위해 활용된다. 기술 통계 (Descriptive statisctics) 모집단으로부터 표본을 추출.. 2021. 12. 1.
ADP) 의사결정나무 예제 (+파이썬으로 분류트리, 회귀트리 구현하기) 의사결정나무(=결정트리, Decision Tree)란? 분류와 회귀 문제에 널리 사용한다. 결정에 다다르기 위해 예/아니오 질문을 이어 나가면서 학습한다. 트리의 노드node는 질문이나 정답을 담은 네모 상자이다. 특히 마지막 노드는 리프leaf라고도 한다. if-then 규칙의 가장 마지막 부분, 혹은 트리의 마지막 가지 부분을 의미한다. 트리 모델에서 잎 노드는 어떤 레코드에 적용할 최종적인 분류 규칙을 의미한다. 엣지edge는 질문의 답과 다음 질문을 연결한다. 맨 위의 노드는 루트노드root node이다. 결정 트리를 학습한다는 것은 정답에 가장 빨리 도달하는 예/아니오 질문 목록을 학습한다는 뜻이다. 머신러닝에서는 이런 질문들을 테스트라고 한다. 트리를 만들 때 알고리즘은 가능한 모든 테스트(질.. 2021. 12. 1.
ADP) ADP 실기 기출문제 모음 (17, 18, 19, 20, 21, 22, 23, 24, 25, 26회) ADP 실기 문제집을 사기보다, 필기 문제집에 있는 각종 데이터마이닝 예제들을 직접 코드로 짜보는 것이 좋다는 후기들을 읽고, 코드 예제를 작성할 주제 목록을 잔뜩 만들었다. (정리하는데 꽤나 걸릴 것 같다 ^^;) https://lovelydiary.tistory.com/380 ADP) ADP 실기 준비 - 주제 목록 내년 시행될 ADP 실기를 앞두고 아래와 같이 코딩 연습을 할 주제의 목차들을 정해보았다. 내용은 및 책을 기반으로 작성하였다. 가능한 한 빠뜨리는 내용 없이 모두 코드 작성을 해보려고 꼼꼼 lovelydiary.tistory.com 이외에도 어떻게 문제가 나왔었는지 알아야 할 것 같아서, 인터넷 서칭을 통해 여러 앞선 수험자분들이 복기해놓은 ADP 실기 기출문제들을 아래에 정리해보았다... 2021. 11. 26.
ADP) ADP 실기 준비 - 주제 목록 내년 시행될 ADP 실기를 앞두고 아래와 같이 코딩 연습을 할 주제의 목차들을 정해보았다. 내용은 및 책을 기반으로 작성하였다. 가능한 한 빠뜨리는 내용 없이 모두 코드 작성을 해보려고 꼼꼼하게 고르고 골라 목록을 만들었다. [ 1 ] 데이터마이닝 1 ] 지도학습 의사결정나무: CART, C5.0, C4.5, CHAID, 분리기준 (카이제곱통계량 p값, 지니 지수, 엔트로피 지수, F통계량, 분산의 감소량), 가지치기 앙상블분석: 배깅, 부스팅(Adaboost), 랜덤포레스트, 스태킹, 엑스트라트리, 에이다부스트 인공신경망 활성화함수(계단함수, 부호함수, 시그모이드 함수, relu함수, softmax 함수) 다층퍼셉트론 ANN, DNN, CNN, RNN, GAN(InfoGAN, CycleGAN), RBM.. 2021. 11. 25.
30회 ADsP 및 23회 ADP 필기 시험 합격 후기 (+비전공) 30회 ADsP 시험 합격 후기 시험은 지난 8월 말에 봤는데 후기는 11월 중순이 되어서야 써 본다. 인문계 출신 비전공자로서 통계학과 프로그래밍은 새로운 도전이었다. 그렇기 때문에 열심히 공부 했지만, 시험을 앞두고는 결과에 대해서 확신이 없어서 불안해 하고 있었다. 이 불안감은 다행히도 시험지를 받고 문제를 훑어볼 때 사라지기 시작했다. 문제를 풀면 풀수록 이 정도면 합격할 수 있겠다 하는 자신감이 생겼다. 문제를 다 풀고나서 네이버 카페에 가서 다른 사람들과 답을 맞춰볼 때 어느 정도 합격할 수 있겠다하는 생각이 들었고, 결과는 합격이었다. 공부는 많은 ADsP 수험생들이 사용한다고 하는 데이터 에듀의 2021 ADsP 데이터 분석 준전문가 책으로 공부했다. 3회독 정도 한 것 같고 보다가 중요해.. 2021. 11. 16.