1. 학습
  2. /
  3. 강의
  4. /
  5. 마케팅 애널리틱스: Python으로 고객 이탈 예측하기

Connected

연습 문제

학습 데이터셋 크기 바꾸기

학습 세트와 테스트 세트의 크기는 모델 성능에 영향을 줍니다. 일반적으로 학습 데이터가 많을수록 모델은 더 잘 학습해요. 하지만 학습 데이터에 과적합되어 새로운 데이터에 일반화하지 못할 위험이 있으므로, 모델의 일반화 성능을 제대로 평가하려면 충분한 테스트 데이터가 필요합니다. 따라서 학습에 사용할 양과 테스트로 남겨둘 양 사이에는 중요한 균형과 트레이드오프가 존재합니다.

지금까지는 학습에 70%, 테스트에 30%를 사용했습니다. 이제 학습에 80%를 사용해 보고, 그것이 모델 성능에 어떤 변화를 주는지 평가해 봅시다.

지침 1/3

undefined XP
    1
    2
    3
  • 전체 데이터의 80%를 학습에 사용하고 20%를 테스트로 보류하여 학습 세트와 테스트 세트를 만드세요.