1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서의 모델 검증

Connected

연습 문제

두 개의 홀드아웃 세트 만들기

최근에 상사를 위해 Tic-Tac-Toe 게임의 승리를 예측하는 간단한 랜덤 포레스트 모델을 만들었고, 요청에 따라 매개변수 튜닝은 하지 않았어요. 안타깝게도 전체 모델 정확도가 상사의 기준에 미치지 못했습니다. 이번에는 모델 성능에 집중해 달라고 요청받았어요.

서로 다른 모델과 매개변수 조합을 시험하기 전에, 데이터를 학습, 검증, 테스트 데이터세트로 분할해야 합니다. 데이터를 학습과 테스트 데이터세트로 먼저 나눈 뒤, 학습 데이터세트를 다시 분할해 검증 데이터세트를 만든다는 점을 기억하세요.

데이터세트 X와 y는 이미 불러와져 있어 바로 사용하실 수 있습니다.

지침

100 XP
  • 임시 데이터세트와 테스트 데이터세트(X_test, y_test)를 만드세요. 테스트 데이터세트에는 전체 데이터의 20%를 사용하세요.
  • 임시 데이터세트(X_temp, y_temp)를 사용해 학습(X_train, y_train)과 검증(X_val, y_val) 데이터세트를 만드세요.
  • 검증 데이터세트에는 임시 데이터의 25%를 사용하세요.