본문 바로가기
개발 Tools/파이썬_Deep learning & ML

머신러닝 fit_transform() 과 transform()의 차이점

by 전컴반 2021. 12. 12.
반응형

바로 들어가겠다.

 

fit() 

 

fit이란 정규화를 하는 것이다.

MinMax에서는 최소와 최대를 인지하는 작업이다.

Standardscler에서는 평균과 편차를 계산하는 작업이다

 

transform() & fit_transform()

 

예를 들어 MinMax를 하는 train 데이터에 (2, 3, 4, 5)가 들어있다. 이걸 fit_transform() 하면 최솟값인 2는 0으로 최댓값인 5는 1로 매핑된다.

근데 test 데이터에 (2, 3, 4, 6)이 들어있다. train 데이터에서는 5가 최대라고 했는데 6이 있다면 어떻게 해야 할까??

 

5를 그대로 1로 매핑하고 6을 1.2.로 매핑한다. train데이터와 test데이터가 같은 조건으로 맞춰줘야 하기 때문에 test데이터에서는 fit()을 하지 않고 transform()만 적용해야 한다.

 

정리하면

1. train 데이터에서 fit_transform()을 하여 범위를 맞추고 모델을 생성한다. 

2. 위에서 사용한 범위를 그대로 이용하기 위해 test 데이터에서는 새로 fit()을 하지 않고 trasform()만 사용한다.

 

반응형

댓글