반응형
데이터를 분류하는 방법 중에 하나인 KFold와 Stratified_KFold가 있다.
이 두 방법의 API가 바로 cross_val_score 이다.
바로 코드를 보겠다.
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import cross_val_score, cross_validate
iris_data = load_iris()
df_clf = DecisionTreeClassifier(random_state=999)
data = iris_data.data
target = iris_data.target
scores = cross_val_score(estimator=df_clf, X=data, y=target, scoring="accuracy", cv=3)
print(scores) # [0.98 0.91 1] 이렇게 나옴
print(scores.mean())
출력
[0.98 0.94 1. ]
0.9733333333333333
estimator = 평가자 , 데이터
X = 피처 데이터 세트, 대문자임을 주의
y = 타깃 데이터
scoring = 예측 성능 평가 지표
cv = 교차 검증 폴드 수
반응형
'개발 Tools > 파이썬_Deep learning & ML' 카테고리의 다른 글
머신러닝 StandardScaler(표준화) (0) | 2021.07.15 |
---|---|
머신러닝 GridSearch(그리드 서치) (cv_results_, best_params_ , best_score_, estimator, param_grid, scoring, cv, refit) (0) | 2021.07.15 |
머신러닝 Stratified KFold (0) | 2021.07.13 |
머신러닝 KFold (n_splits) (0) | 2021.07.13 |
지역별 전기 사용량 군집화 (덴드로그램, KMeans, 클러스트링, pandas code pretty) (0) | 2021.05.01 |
댓글