본문 바로가기

Study history32

ADP) 파이썬으로 푸는 ADP실기 데이터 분석전문가 모의고사 1회-(2) 『ADP 실기 데이터 분석 전문가』 모의고사 1회_통계분석 Q1) FIFA데이터에서 각 선수의 키는 Heghit변수에 피트와 인치로 입력되어 있습니다. 이를 cm로 변환하여 새로운 변수 Height_cm을 생성하시오. ( “ ' ” 앞의 숫자는 피트이며, “ ' ” 뒤의 숫자는 인치, 1피트 = 30cm, 1인치 = 2.5cm) df['Height']에 있는 값들은 데이터타입이 object로서 5'7의 형태로 되어 있다. 5'7은 5피트 7인치라는 의미이다. 이에 df['Height']에 lambda식을 사용하여 5'7 이라는 값을 '을 기준으로 split하여 분리하면 나오는 첫번째 값(인덱스[0])은 피트이고 두번째 값(인덱스[1])은 인치이다. 이에 각각을 int()함수를 통해 숫자로 변환한 후 30.. 2022. 1. 20.
ADP) 3-4. 파이썬 그래프 총정리 - 5탄: 서브플롯, 두개의 Y축을 가진 그래프 그리기, Seaborn palette 종류 살펴보기 기타 - 서브플롯 서브플롯 기능을 활용해서 여러 그래프를 한데 모아 그릴 수도 있다. 서브플롯의 주요 기능들을 정리하면 아래와 같다. subplot 그리기: fig, (ax1, ax2...) = pyplot.subplots() fig.subplots_adjust(wspace=플롯들 사이의 너비, hspace=플롯들 사이의 높이) fig.suptitle('전체제목/슈퍼타이틀') ax1.title.set_text('서브플롯 제목') ax1.title.set_fontsize(10) ax1.title.set_color('#000000') ax1.legend(labels=[ , ,], title='범주', bbox_to_anchor=(1,1)) ax1.grid() ax1.set(xlabel=' ', ylabel=.. 2021. 12. 17.
ADP) 3-4. 파이썬 그래프 총정리 - 4탄: 히트맵, 체르노프 페이스, 스타차트(거미줄차트,방사형차트), 평형좌표계, 다차원척도법 비교 시각화 - 1. 히트맵 여러가지 변수를 비교할 수 있다. 한칸의 색상으로 데이터 값을 표현한다. 하나의 대상에 해당하는 한 행을 왼쪽에서 오른쪽으로 보면서 모든 변수를 파악할 수 있고, 하나의 변수에 대응하는 한 열을 위에서 아래로 읽을 수도 있다. 히트맵은 seaborn 패키지의 heatmap()함수로 구현한다. 데이터는 상관행렬 데이터를 입력해야 한다. 상관행렬 데이터는 데이터프레임객체에 .corr()함으로써 구한다. 그럼 짝지은 열 데이터 끼리의 상관계수를 반환해 준다. 아래의 cmap 파라미터는 palette와 동일하다고 보면 된다. 비교 시각화 - 2. 체르노프 페이스 데이터를 사람의 얼굴 이미지로 표현하는 방법이다. 얼굴의 가로 너비, 세로높이, 눈, 코, 잎, 귀 등 각 부위를 변수로 .. 2021. 12. 17.
ADP) 3-4. 파이썬 그래프 총정리 - 3탄: 스캐터플롯(산점도), 버블차트, 히스토그램, 페어플롯 관계 시각화 - 1. 스캐터 플롯 (산점도) 두 데이터 항목의 공통변이를 나타내는 2차원 도표이다. 데이터에서의 관계를 시각화 하는데 적합한 방법이다. 데이터 포인트들의 관련성 여부를 시각적으로 판단할 수 있다. (양의 상관관계, 음의 상관관계) plt.scatter(x축 데이터리스트, y축 데이터리스트)로 그리거나, seaborn의 sns.scatterplot()으로 그릴 수 있다. 여기서 sns.regplot()을 하게 되면 회귀선과 신뢰범위까지 음영으로 표시된다. plt.scatter에 추세선과 회귀식을 추가하고 싶다면 numpy의 polyfit과 poly1d 함수를 사용해서 기울기와 절편값을 가지고 올 수도 있다. 관계 시각화 - 2. 버블차트 세가지 요소의 상관관계를 표현할 수 있는 방법이다. .. 2021. 12. 17.
ADP) 3-4. 파이썬 그래프 총정리 - 2탄: 파이그래프/도넛차트, 트리맵, 모자이크플롯, 누적연속 선그래프, 줄기잎그림, 박스플롯/바이올린플롯 분포 시각화 - 1. 파이 그래프, 도넛차트 원 그래프는 부분과 전체, 부분과 부분 간의 비율을 알아보는데 사용되는 방법이다. 모든 조각의 합은 100%이다. 내용을 설명하기 위한 텍스트와 퍼센티지를 포함시키는 것이 좋다. 면적으로 값을 보여주고 수치를 각도로 표시한다. 도넛차트는 파이그래프와 마찬가지로 수치를 각도로 표시한다. 조각에 해당하는 수치는 조각의 면적이 아닌 도넛조각의 길이로 표시한다. 아래는 숫자리스트를 객체로 넣고, 객체.plot.pie()로 파이 그래프를 구현하고, 괄호 안 파라미터 labels에 각 숫자값에 해당하는 범주의 이름 리스트를 파라미터로 적용하였다. plt.pie(값 리스트, labels=범주 리스트)로 표현할 수도 있다. pie 그래프 하나로 파라미터를 설정함으로써 파이그.. 2021. 12. 17.