Intuition zum Undersampling
Noch ein Intuitions-Check! Du hast jetzt die Effekte des Undersamplings des Trainingssets gesehen, um die Vorhersage von Ausfällen zu verbessern. Du hast das Trainingsset X_train undersampelt, und das hatte einen positiven Einfluss auf die AUC und die Recall-Rate für Ausfälle des neuen Modells. Die Trainingsdaten hatten ein Klassenungleichgewicht, was für die meisten Kreditdaten normal ist.
Du hast die Testdaten X_test nicht undersampelt. Warum solltest du das Testset nicht ebenfalls undersampeln?
Diese Übung ist Teil des Kurses
<Kurs>Kreditrisikomodellierung in Python</Kurs>Interaktive praktische Übung
Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis
Übung starten