scikit-learn의 KFold()

무작위 숲(random forest) 모델을 만들고 샘플 밖 정확도를 계산하는 동료의 코드를 방금 실행해 보았어요. 그런데 동료의 코드에 random_state 설정이 없어서, 발견된 오류가 동료가 보고한 오류와 완전히 다르다는 점을 눈치챘어요.

이 무작위 숲 모델이 새로운 데이터에서 얼마나 정확할지 더 잘 추정하기 위해, KFold 교차 검증에 사용할 인덱스를 생성하기로 했어요.