#.1 머신러닝 시스템의 작업 흐름
1) 데이터 준비: 각 사례, instance가 모인 데이터셋 준비 필요
2) 모델 구축: 예측하고자 하는 값이 label, 나머지 변수들은 features
features를 입력했을 때 label이 나올 수 있도록 모델을 구축해야 함
3) 모델 평가: 구축된 머신러닝 모델에 예측된 결과 값을 알고 있는 featuers들을 입력하여 실제 값과 예측 값을 비교
4) 모델 최적화: 모델 매개변수 조정, 특성의 부차 집합을 선택, 데이터 전처리를 통해 모델 정확도를 향상시킬 것
5) 신규 데이터 예측 (각 단계를 계속 반복)
#2. 머신러닝 관련 주요 용어 정리
1) instance: 단일 객체, 관측 내용
2) label: 관심 대상의 숫자 또는 범주 속성. 각각의 새로운 instance를 가지고 예측할 변수
3) features: 대상을 예측하는 데 사용되는 입력 속성
4) model: feature와 label 간의 관계를 설명하는 수학적 개체
5) training data: 머신러닝 모델에 적합하게 하기 위해 사용하는, label 값이 알려진 사례들로 구성한 집합
[출처: 위키북스 <리얼월드 머신러닝>]
'Python notes > Data Science & Machine Learning' 카테고리의 다른 글
R) R에 있는 내장 데이터들 불러오기 (ChickWeight, Titanic, ToothGrowth, iris3 등) (0) | 2021.06.29 |
---|---|
파이썬) pandas 모듈로 csv, txt, excel 파일 불러오기 및 저장하기 (0) | 2021.06.01 |
파이썬) 여러가지 집계함수 한번에 계산하기 (+Pandas DataFrame, agg함수) (0) | 2021.05.17 |
파이썬) 그래프 그리기 (+matplotlib, pyplot 함수들) (0) | 2021.04.28 |
파이썬-머신러닝) 머신러닝이란? (1) (0) | 2019.08.27 |
댓글