Intuïtie bij undersampling
Nog een intuïtiecheck! Je hebt nu de effecten gezien van het ondersamplen van de trainingsset om wanbetalingen beter te voorspellen. Je hebt de trainingsgegevensset X_train ondersampled, en dat had een positief effect op de AUC-score van het nieuwe model en de recall voor wanbetalingen. De trainingsdata had klasse-ongelijkheid, wat normaal is voor de meeste kredietdata.
Je hebt de testdata X_test niet ondersampled. Waarom zou je de testset ook niet ondersamplen?
Deze oefening maakt deel uit van de cursus
Kredietrisicomodellering in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen