본문 바로가기
Python notes/Data Science & Machine Learning

파이썬-머신러닝) 머신러닝이란? (2)

by 성실한 나무 2019. 8. 28.

#.1 머신러닝 시스템의 작업 흐름

  1) 데이터 준비: 각 사례, instance가 모인 데이터셋 준비 필요

  2) 모델 구축: 예측하고자 하는 값이 label, 나머지 변수들은 features

                      features를 입력했을 때 label이 나올 수 있도록 모델을 구축해야 함

  3) 모델 평가: 구축된 머신러닝 모델에 예측된 결과 값을 알고 있는 featuers들을 입력하여 실제 값과 예측 값을 비교 

  4) 모델 최적화: 모델 매개변수 조정, 특성의 부차 집합을 선택, 데이터 전처리를 통해 모델 정확도를 향상시킬 것

  5) 신규 데이터 예측 (각 단계를 계속 반복)

 

#2. 머신러닝 관련 주요 용어 정리

  1) instance: 단일 객체, 관측 내용

  2) label: 관심 대상의 숫자 또는 범주 속성. 각각의 새로운 instance를 가지고 예측할 변수

  3) features: 대상을 예측하는 데 사용되는 입력 속성

  4) model: feature와 label 간의 관계를 설명하는 수학적 개체

  5) training data: 머신러닝 모델에 적합하게 하기 위해 사용하는, label 값이 알려진 사례들로 구성한 집합

  

 

[출처: 위키북스 <리얼월드 머신러닝>]

댓글