1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 Dask로 병렬 프로그래밍

Connected

연습 문제

지연 평가로 train-test 분할

X 변수는 이미 변환했어요. 이제 y 변수를 변환하고 데이터를 학습용과 테스트용 세트로 나누어 데이터 준비를 마무리하세요.

이전 연습 문제에서 만든 변수 X와 y는 현재 환경에 준비되어 있어요.

지침

100 XP
  • dask_ml.model_selection에서 train_test_split() 함수를 임포트하세요.
  • y의 인기 점수는 0-100 범위이므로, 100으로 나누어 0-1 범위가 되도록 정규화하세요.
  • train_test_split() 함수를 사용해 데이터를 학습 세트와 테스트 세트로 분할하세요. 데이터를 섞이도록(shuffle) 설정하고, 테스트 비율을 전체 데이터의 20%로 지정하세요.