Intuïtie bij undersampling

Nog een intuïtiecheck! Je hebt nu de effecten gezien van het ondersamplen van de trainingsset om wanbetalingen beter te voorspellen. Je hebt de trainingsgegevensset X_train ondersampled, en dat had een positief effect op de AUC-score van het nieuwe model en de recall voor wanbetalingen. De trainingsdata had klasse-ongelijkheid, wat normaal is voor de meeste kredietdata.

Je hebt de testdata X_test niet ondersampled. Waarom zou je de testset ook niet ondersamplen?

Deze oefening maakt deel uit van de cursus

Kredietrisicomodellering in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Zet theorie om in actie met een van onze interactieve oefeningen

Begin oefening