LoslegenKostenlos loslegen

Ein Modell auf Test und Train auswerten

Die Funktion auc_train_test berechnet die AUC eines Modells, das auf einem train-Set erstellt und auf einem test-Set ausgewertet wird:

auc_train, auc_test = auc_train_test(variables, target, train, test)

wobei variables eine Liste der Namen der Variablen ist, die im Modell verwendet werden.

In dieser Übung wendest du diese Funktion an und prüfst, ob die Train- und Test-AUC ähnlich sind.

Diese Übung ist Teil des Kurses

Einführung in Predictive Analytics mit Python

Kurs anzeigen

Anleitung zur Übung

  • Die basetable ist geladen. Teile die Basistabelle so auf, dass der Train-Set 70 % der Daten enthält, und stelle sicher, dass Train- und Test-Set die gleiche Zielinzidenz haben.
  • Berechne die Train- und Test-AUC des Modells mit "age" und "gender_F" als Prädiktoren mithilfe der Funktion auc_train_test.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load the partitioning module
from sklearn.model_selection import train_test_split

# Create DataFrames with variables and target
X = basetable.drop('target', 1)
y = basetable["target"]

# Carry out 70-30 partititioning with stratification
X_train, X_test, y_train, y_test = ____(X, y, test_size = ____, stratify = ____)

# Create the final train and test basetables
train = pd.concat([X_train, y_train], axis=1)
test = pd.concat([X_test, y_test], axis=1)

 # Apply the auc_train_test function
auc_train, auc_test = ____([____, ____], ["target"], ____, ____)
print(round(auc_train,2))
print(round(auc_test,2))
Code bearbeiten und ausführen