본문 바로가기
개발 Tools/파이썬_개념

바이어스와 분산의 관계 (교차검증, 부트스트랩)

by 전컴반 2021. 11. 24.
반응형
바이어스와 분산은 트레이드오프 관계

 

일반적으로 용량이 적은 모델은 바이어스는 크고 분산이 작고, 복잡한 모델은 바이어스는 작고 분산은 크다. 기계학습의 목표는 낮은 바이어스와 낮은 분산을 가진 예측기를 제작하는 것이다.

 

 

보통 검증집합과 테스트 집합을 나누어 모델을 훈련시키는데 추가적으로 교차검증과 부트스트랩 방식이 있다.

 

교차검증

- 훈련집합을 등분하여 학습과 평가 과정을 여러 번 반복하여 평균을 구하여 사용한다.

 

부트스트랩

-  난수를 이용하여 샘플링을 반복한다.

- 데이터가 적을 때 사용하면 좋다

 

반응형

댓글