머신러닝 용어정리

Page content

머신러닝을 위한 용어 정리

피처(Feature) = 속성

  • 피처는 데이터 세트의 일반 속성임
  • 머신러닝은 2차원 이상의 다차원 데이터에서도 많이 사용되므로 타겟값을 제외한 나머지 속성을 모두 피처로 지칭

레이블, 클래스, 타겟(값), 결정(값)

  • 타겟값 또는 결정값은 지도 학습 시 데이터의 학습을 위해 주어지는 정답 데이터
  • 지도 학습 중 분류의 경우에는 이 결정값을 레이블 또는 클래스로 지칭

지도학습이란?

지도학습은 명확한 정답이 주어진 데이터를 먼저 학습한 뒤 미지의 정답을 예측하는 방식입니다. 이 때 학습을 위해 주어진 데이터 세트를 학습 데이터 세트, 머신러닝 모델의 예측 성능을 평가하기 위해 별도로 주어진 데이터 세트를 테스트 데이터 세트로 지칭합니다.

분류란?

분류(Classification)은 대표적인 지도학습(Supevised Learning) 방법의 하나입니다. 지도학습은 학습을 위한 다양한 피처와 분류 결정값인 레이블(Label) 데이터로 모델을 학습한 뒤, 별도의 테스트 데이터 세트에서 미지의 레이블을 예측합니다.

데이터 분류 예측 프로세스

  1. 데이터 세트 분리 : 데이터를 학습 데이터와 테스트 데이터로 분리합니다.

  2. 모델 학습 : 학습 데이터를 기반으로 ML 알고리즘을 적용해 모델을 학습시킵니다.

  3. 예측 수행 : 학습된 ML 모델을 이용해 테스트 데이터의 분류를 예측합니다.

  4. 평가 : 이렇게 예측된 결과값과 테스트 데이터의 실제 결과값을 비교해 ML 모델의 성능을 평가합니다.