SMOTE와 원본 데이터 비교

이전 연습 문제에서 SMOTE를 사용하면 소수 클래스의 관측치가 크게 늘어나는 것을 보셨죠. 이제 그 결과를 원본 데이터와 비교해 보며 실제로 어떤 변화가 있었는지 감을 잡아 봅시다. 먼저 옛 데이터와 새 데이터의 값 분포(value counts)를 다시 확인하고, 두 데이터의 산점도를 나란히 그려 보겠습니다. 이를 위해 미리 정의된 함수 compare_plot()을 사용할 거예요. 이 함수는 다음 인수를 받습니다: X, y, X_resampled, y_resampled, method=''. 이 함수는 원본 데이터의 산점도와 리샘플링된 데이터를 나란히 표시합니다.