본문 바로가기

Study history32

ADP) ADP 24회 실기 시험 후기 및 문제 복기 #1. 첫 ADP 24회 실기 시험 후기 지난 3월 26일 토요일 오전 10시, 서일대 배양관에서 나의 첫 ADP 24회 실기 시험을 치렀다. 일단 여기서 '첫'이라는 단어를 붙였다는 의미는 몇번 더 봐야겠다는 미래를 내다본 워딩이다. (ㅎㅎ) 결론적으로 이번 시험은 여러 문제를 부실하게 답변했고, 심지어 몇몇 문제는 빈칸으로 제출을 했기 때문에 불합격할 예정이다. 그래서 이젠 다시 25회 실기 시험을 준비하려고 한다. 다른 분들을 위해 ADP 실기 시험을 어떻게 진행하는지 몇자 적어보고자 한다. 시험 시간: 오전 10시부터 오후 2시까지 총 4시간 (시험 시작 후, 30분 이후부터 손을 들어 확인 후, 화장실을 다녀올 수 있다) 시험 방법: 컴퓨터를 통해 가상환경으로 문제를 풀고 제출한다. 오픈북으로 .. 2022. 3. 28.
ADP) 파이썬으로 푸는 ADP실기 데이터 분석전문가 모의고사 2회-(3) 『ADP 실기 데이터 분석 전문가』 모의고사 2회_비정형데이터 Q1) ‘연설문.txt’ 데이터를 읽어온 뒤 숫자, 특수 문자 등을 제거하는 전처리 작업을 시행하시오 .txt로 된 파일은 pandas의 read_table로 읽어오거나 아래처럼 with open as f 형식으로 읽어와서 read를 하거나 readlines를 학나 하는 식으로 불러올 수 있다. 아래에서는 전체 내용을 f.read()로 읽어오고 전체 문장에서 숫자, 특수문자를 제거한 형태로 전처리를 하였다. 전처리를 할 때는 re 패키지의 sub이라는 메서드를 사용하였다. 첫번째 argument로 정규식을 입력하고 두번째 argument에 대체할 단어를 넣고, 세번째에 전처리 규칙을 적용할 텍스트를 입력하면 된다. 여기서 사용한 sub의 기능.. 2022. 1. 22.
ADP) 파이썬으로 푸는 ADP실기 데이터 분석전문가 모의고사 2회-(2) 『ADP 실기 데이터 분석 전문가』 모의고사 2회_정형데이터 Q1) cabin, embarked변수의 값 중 ""로 처리된 값을 NA로 바꾸고 아래의 데이터 테이블을 보고 문자형, 범주형 변수들을 각각 character, factor형으로 변환하시오. 또, 수치형 변수가 NA인 값을 중앙값으로 대체하고, 범주형 변수가 NA인 값을 최빈값으로 대체하고 age변수를 아래의 표와 같이 구간화하여 age_1이라는 변수를 생성하고 추가하시오. 데이터 분석 공부 입문자용으로 유명한 titanic.csv 파일을 가지고 정형데이터 마이닝을 진행한다. 문제에서 요구한 여러가지 전처리를 아래와 같이 실행하였다. 문제가 R위주로 나왔기 때문에 python에 맞지 않는 부분도 있지만 일단은 문제에서 요청한 모든 것을 적용해보.. 2022. 1. 22.
ADP) 파이썬으로 푸는 ADP실기 데이터 분석전문가 모의고사 2회-(1) 『ADP 실기 데이터 분석 전문가』 모의고사 2회_통계분석 Q1) 종속변수인 chance_of_admit(입학 허가 확률)와 독립변수(GRE, TOEFL, Univ_Rating, SOP, LOR, CGPA)에 대해 피어슨 상관계수를 이용한 상관관계 분석을 수행하고 그래프를 이용하여 분석결과를 설명하시오 문제에서 제시한 feature들에 대해서 아래와 같이 데이터프레임을 만든 후 .corr()라는 간단한 방식으로 피어슨 상관계수를 이용한 상관관계 분석을 할 수 있다. 또한, 해당 메서드를 통해 만든 cor_mx 즉, 상관계수 매트릭스를 sns.heatmap(cor_mx)로 입력하면 히트맵으로 시각화도 가능하다. 이렇게 데이터프레임의 메서드를 사용하는 방법 외에도 scipy 패키지를 통해 pearsonr로 .. 2022. 1. 22.
ADP) 파이썬으로 푸는 ADP실기 데이터 분석전문가 모의고사 1회-(3) 『ADP 실기 데이터 분석 전문가』 모의고사 1회_비정형데이터 Q1) ‘영화 기생충_review.txt’ 데이터를 읽어온 뒤 숫자, 특수 문자 등을 제거하는 전처리 작업을 시행하시오. 그리고 ‘영화 기생충_review.txt’을 사전에 등록하라. pandas의 read_table로 .txt을 불러온 후, 각 행들을 txt라는 객체 안에 하나의 string으로 모두 합치는 작업을 진행했다. 그리고나서 숫자, 특수문자 등을 제거하는 전처리 작업을 진행하게 되는데 수동으로도 하고 정규식을 사용한 자동 전처리도 해보았다. 그리고 나서 전처리 결과를 with open("경로/파일명", 'w', encoding='euc-kr') as f: f.write(txt)로 .txt 파일을 저장하였다. Q2) ‘영화 기생충_.. 2022. 1. 21.