Python notes/Data Science & Machine Learning
파이썬-머신러닝) 머신러닝이란? (2)
성실한 나무
2019. 8. 28. 16:20
#.1 머신러닝 시스템의 작업 흐름
1) 데이터 준비: 각 사례, instance가 모인 데이터셋 준비 필요
2) 모델 구축: 예측하고자 하는 값이 label, 나머지 변수들은 features
features를 입력했을 때 label이 나올 수 있도록 모델을 구축해야 함
3) 모델 평가: 구축된 머신러닝 모델에 예측된 결과 값을 알고 있는 featuers들을 입력하여 실제 값과 예측 값을 비교
4) 모델 최적화: 모델 매개변수 조정, 특성의 부차 집합을 선택, 데이터 전처리를 통해 모델 정확도를 향상시킬 것
5) 신규 데이터 예측 (각 단계를 계속 반복)
#2. 머신러닝 관련 주요 용어 정리
1) instance: 단일 객체, 관측 내용
2) label: 관심 대상의 숫자 또는 범주 속성. 각각의 새로운 instance를 가지고 예측할 변수
3) features: 대상을 예측하는 데 사용되는 입력 속성
4) model: feature와 label 간의 관계를 설명하는 수학적 개체
5) training data: 머신러닝 모델에 적합하게 하기 위해 사용하는, label 값이 알려진 사례들로 구성한 집합
[출처: 위키북스 <리얼월드 머신러닝>]