1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 차원 축소

Connected

Exercises

Train - test split

이번 장에서도 ANSUR 데이터셋을 계속 사용해 보겠습니다. 데이터셋으로 모델을 만들기 전에, 먼저 어떤 피처를 예측할지 결정해야 해요. 여기서는 성별을 예측해 보겠습니다.

이 피처가 들어 있는 열을 데이터셋에서 분리한 다음, 데이터를 학습 세트와 테스트 세트로 나눠야 합니다. 학습 세트는 모델 학습에, 테스트 세트는 보지 못한 데이터에서의 성능을 확인하는 데 사용돼요.

ansur_df는 미리 로드되어 있습니다.

คำแนะนำ

100 XP
  • sklearn.model_selection에서 train_test_split 함수를 임포트하세요.
  • 'Gender' 열을 y에 할당하세요.
  • DataFrame에서 'Gender' 열을 제거하고 결과를 X에 할당하세요.
  • 테스트 크기를 30%로 설정하여 학습 70%, 테스트 30%로 나누세요.