1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 마케팅용 Machine Learning

Connected

연습 문제

학습용과 테스트용 데이터로 분할하기

이제 몇 가지 간단한 단계만 따라 하면 end-to-end Machine Learning 모델을 만들 준비가 되었어요! 모델링의 세부적인 차이는 다음 장에서 더 깊이 살펴보지만, 지금은 핵심 단계를 연습하고 이해하는 데 집중해 볼게요.

독립 변수 특징은 X라는 pandas DataFrame으로, 종속 값은 Y라는 pandas Series로 미리 로드되어 있어요.

또한 sklearn 라이브러리에서 train_test_split 함수도 불러와 두었습니다. 이제 학습용과 테스트용 데이터셋을 만들고, 데이터가 올바르게 분할되었는지 확인해 보세요.

지침

100 XP
  • X와 Y를 학습용과 테스트용으로 분할하되, 전체 데이터의 25%가 테스트에 사용되도록 하세요.
  • 학습용 데이터셋이 원본 데이터의 75%만 포함하는지 확인하세요.
  • 테스트용 데이터셋이 원본 데이터의 25%만 포함하는지 확인하세요.