본문 바로가기

분류 전체보기196

공모전) 2022 KOPIS 빅데이터 분석 공모전 장려상 후기 #1. KOPIS 빅데이터 분석 공모전 후기 ADP 자격증 취득을 위해 데이터 분석을 공부하면서 참 많은 것을 알게 되었다. 이 지식들을 활용해 볼 방법이 없을까? 분석 스킬을 더 발전시키려면 무엇을 하면 좋을까? 하는 물음에서 블로그에 공부한 내용을 정리하기 시작했다. 그 후에 Kaggle과 Dacon도 어슬렁 거리기 시작했고, 데이터 분석 공모전에도 참여하게 되었다. 그리고 3~4번의 빅데이터 분석 공모전의 문을 두드린 끝에 "2022 KOPIS 빅데이터 분석 공모전 장려상 수상"이라는 결실을 얻게 되었다. 참 감사한 일이다. 운도 좋았던 것 같다. ^^ 공모전은 서류 심사와 멘토링, PT 발표로 크게 세 단계에 걸쳐서 진행되었다. 서류 심사에 통과한 18팀은 입상, 그 중 1팀이 최우수상, 2팀이 .. 2022. 10. 22.
ADP) ADP 26회 실기 예비합격 후기 (+비전공자, 3수 공부법) #1. 드디어 합격! ADP 실기 합격 후기를 언제쯤 블로그에 올릴 수 있을까 항상 궁금했는데, 이번에 드디어 합격을 하였다. ^^ 엄청난 점수를 받은 것도 아니고 턱걸이로 합격한 것이지만 그래도 나의 경험이 다른 분들의 합격에 조금이라도 도움이 되길 바라며 그 간의 공부 히스토리를 적어본다. #2. 3수 히스토리 # 2-1. ADsP와 ADP 필기 그리고 24회 ADP 실기... 작년 4월 국비지원 프로그램으로 처음으로 코딩과 파이썬을 접한 이후, 8월 ADsP 시험을 목표로 5월부터 데이터 분석 공부를 시작했다. 비록 비전공자였기 때문에 생소한 내용들이었지만, 새로운 분야이기도 하고 내용이 흥미로웠기 때문에 재미있게 공부를 했던 것 같다. 덕분에 30회 ADsP와 23회 ADP 필기를 운좋게 한번에 .. 2022. 10. 15.
Python Errors) ValueError: endog must be in the unit interval. 에러 해결 #1. statsmodels로 Logistic Regression을 하고 있었는데 만난 또 다른 에러... ValueError: endog must be in the unit interval 에러 내용을 살펴 보니, 값에 문제가 있어서 나는 ValueError이고, endog가 단위 간격에 있어야 한다고 했다. 이게 무슨 말일까. 여튼 데이터 값 중에 문제가 있는 것 같은데 이 상태로는 fitting을 할 수 없었다. 희한한 점은 sklearn의 LogisticRegression에서는 에러가 나지 않았다. #2. 문제 해결 ! 알고보니, statsmodels의 로지스틱 회귀의 경우 타겟 클래스 값이 0과 1로만 입력이 되어야 한다고 한다. 내 데이터에서의 y값은 1과 2로 되어 있었다. 그래서 1을 0으.. 2022. 9. 16.
Python Errors) LinAlgError: Singular matrix 에러 해결 #1. statsmodels로 Logistic regression을 적합하는 중에 만난 에러이다. LinAlgError: Singular matrix LinAlgError는 뭔가 축약어 같은데 뭔지 모르겠지만, 그 뒤에 있는 Singular matrix는 찾아보니 특이행렬이라고 한다. 역행렬이 없는 행렬을 특이행렬이라고 했다. 내가 Logit 적합을 위해 입력한 X 데이터들 중에 특이행렬이 포함된 모양이다. 특이행렬에 대해서 조금 더 찾아보니 데이터 값이 0으로만 구성된 행렬을 말하는 것 같다. 과연, X 데이터들을 살펴보니 몇몇 feature들이 0으로만 구성되어 있었다. #2. 문제 해결! 데이터 사이즈를 좀 더 키워서 0과 1의 클래스가 있도록 특이행렬 feature들의 데이터를 조정하고 다시 Lo.. 2022. 9. 16.
Python errors) TypeError: No loop matching the specified signature and casting was found for ufunc add 해결 1. 클러스터 별로 어떤 특징을 가지는지 확인 하는 와중에 TypeError를 만났다. TypeError: No loop matching the specified signature and casting was found for ufunc add 정확한 해석이 되지는 않는 에러긴 하지만, 데이터 타입에 문제가 있는 듯 했고, 데이터가 사용하려는 함수와 매칭이 되지 않는 것으로 보였다. Type error 화면은 아래와 같았다. pairplot이 그려지다가 말았다. 2. 알고보니, 역시나 데이터 타입에 문제가 있었다. dsr이라는 데이터프레임에서 work_year는 데이터의 연도인데 category로 지정을 안했더니 seaborn에서 수치형 데이터로 인식하고 pairplot안에 포함을 시킨 것이었다. 그런데.. 2022. 8. 25.