본문 바로가기

Python notes/Data Science & Machine Learning14

파이썬) 여러가지 집계함수 한번에 계산하기 (+Pandas DataFrame, agg함수) #1. from Pandas import DataFrame 파이썬의 확장 패키지 중 하나인 Pandas는 여러가지 클래스를 제공해서 데이터를 조작을 편리하게 해준다. Pandas 중에서도 DataFrame 클래스를 사용하면 데이터들을 표로 만들고, 값을 계산하기 좋다. #2. 순서 1) 명령프롬프트(터미널)에서 pip로 pandas 확장 패키지를 설치한다. pip install pandas 2) 파이썬을 켜고 확장패키지와 사용하려는 클래스를 불러온다. from Pandas import DataFrame 3) 데이터 프레임을 정의한다. Pb라는 변수에 리스트를 먼저 할당하고, 그 리스트 객체를 DataFrame()함수로 씌워서 데이터프레임 객체 Pb를 준비한다. 4) 그 객체에 agg()를 사용하고 그 안.. 2021. 5. 17.
파이썬) 그래프 그리기 (+matplotlib, pyplot 함수들) #1. matplotlib 설치 파이썬으로 그래프를 그릴 수 있게 도와주는 확장 패키지인 matplotlib를 설치하고 그래프를 그려보았다. 맥 기준으로 명령어는 (터미널에서 입력): pip3 install matplotlib #2. matplotlib에서 pyplot만 불러오기 from matplotlib import pyplot 그러면 pyplot만 가지고 그래프를 구색을 맞춰 그릴(plotting) 수가 있다. 일단 x축(season)과 Y축(temp)에 들어갈 값들을 담은 리스트를 2개 만든다. 일단 그래프를 그리기 시작할 때(pyplot.figure()), 끝낼 때(pyplot.close()) 쓰는 메서드들을 입력하고 그 가운데에 그래프 내용들을 채워 넣으면 된다. pyplot.title('제목.. 2021. 4. 28.
파이썬-머신러닝) 머신러닝이란? (2) #.1 머신러닝 시스템의 작업 흐름 1) 데이터 준비: 각 사례, instance가 모인 데이터셋 준비 필요 2) 모델 구축: 예측하고자 하는 값이 label, 나머지 변수들은 features features를 입력했을 때 label이 나올 수 있도록 모델을 구축해야 함 3) 모델 평가: 구축된 머신러닝 모델에 예측된 결과 값을 알고 있는 featuers들을 입력하여 실제 값과 예측 값을 비교 4) 모델 최적화: 모델 매개변수 조정, 특성의 부차 집합을 선택, 데이터 전처리를 통해 모델 정확도를 향상시킬 것 5) 신규 데이터 예측 (각 단계를 계속 반복) #2. 머신러닝 관련 주요 용어 정리 1) instance: 단일 객체, 관측 내용 2) label: 관심 대상의 숫자 또는 범주 속성. 각각의 새로운.. 2019. 8. 28.
파이썬-머신러닝) 머신러닝이란? (1) #0. 파이썬으로 머신러닝 모델을 만들 수 있도록 하는 예제 책이 있다고 해서 한번 공부해 보려고 한다. 위키북스의 이다. 요새 IT 업계에서 핫하다는 머신러닝, AI에 대해 공부해 보면 좋을 것 같다. 내가 하는 일에 어떻게 활용할 수 있을까? #1. 머신러닝(machine learning)이 뭐지? - Tom Mitchell "컴퓨터 프로그램이 특정 작업을 수행할 때 그 성능이 경험으로 향상되었음을 수치상으로 말할 수 있으면 그 프로그램은 학습한다고 말할 수 있다" - 예시로부터 배우고 배운 것을 한 번도 본 적 없는 새로운 사례에 적용하는 능력, 즉 일반화 할 수 있는 능력 - 적용 예) 분류(스팸 필터링), 회귀(주식 시장 예측), 추천(제품 추천), 대체(불완전한 환자 의료 기록 보강) - 매개.. 2019. 8. 27.