Intuition zum Undersampling

Noch ein Intuitions-Check! Du hast jetzt die Effekte des Undersamplings des Trainingssets gesehen, um die Vorhersage von Ausfällen zu verbessern. Du hast das Trainingsset X_train undersampelt, und das hatte einen positiven Einfluss auf die AUC und die Recall-Rate für Ausfälle des neuen Modells. Die Trainingsdaten hatten ein Klassenungleichgewicht, was für die meisten Kreditdaten normal ist.

Du hast die Testdaten X_test nicht undersampelt. Warum solltest du das Testset nicht ebenfalls undersampeln?

Diese Übung ist Teil des Kurses

<Kurs>Kreditrisikomodellierung in Python</Kurs>

Kurs ansehen

Interaktive praktische Übung

Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis

Übung starten