데이터 리샘플링

Machine Learning 프로젝트의 첫 단계는 모델 학습과 평가를 위해 학습용과 테스트용 데이터셋을 만드는 일이에요. 테스트 데이터셋은 모델이 새로운 데이터에서 어떻게 작동할지 추정하게 해 주며, 과적합을 방지하는 데 도움이 됩니다.

여러분은 통신사 고객 정보를 담은 telecom_df 데이터셋으로 작업하게 돼요. 반응 변수는 canceled_service이며, 고객이 회사와의 계약을 해지했는지를 기록합니다. 예측 변수에는 고객의 휴대전화와 인터넷 사용 정보, 계약 유형, 월 요금 등이 포함되어 있어요.

telecom_df 티블은 이미 세션에 로드되어 있습니다.