1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서의 모델 검증

Connected

연습 문제

하나의 홀드아웃 세트 만들기

상사가 tic_tac_toe 데이터셋으로 간단한 랜덤 포레스트 모델을 만들어 보라고 했어요. 하이퍼파라미터를 고르는 데 많은 시간을 쓰기보다는, 이 모델이 미래 데이터에서 얼마나 잘 작동할지 알고 싶어 해요. 앞으로의 Tic-Tac-Toe 게임에서 어떤 플레이어가 이길지 모델이 예측할 수 있다면 좋겠죠.

tic_tac_toe 데이터셋은 이미 불러와 두었어요.

Python에서 =\는 한 줄에 담기엔 코드가 너무 길어 두 줄로 나눴다는 표시예요.

지침

100 XP
  • 모든 범주형 열에 대해 더미 변수를 만들어 X 데이터셋을 생성하세요.
  • X와 y를 학습용(X_train, y_train)과 테스트용(X_test, y_test) 데이터셋으로 분할하세요.
  • 테스트 비율을 10%로 사용해 데이터셋을 분할하세요.