LoslegenKostenlos loslegen

Deine erste Pipeline

Dein Kollege hat AdaBoostClassifier für den Credit-Scoring-Datensatz verwendet. Du möchtest außerdem einen Random-Forest-Klassifikator ausprobieren. In dieser Übung passt du diesen Klassifikator an die Daten an und vergleichst ihn mit AdaBoostClassifier. Achte darauf, Train-/Test-Splitting zu verwenden, um Overfitting zu vermeiden. Die Daten sind vorab geladen und so transformiert, dass alle Features numerisch sind. Die Features liegen als X und die Labels als y vor. Das Modul RandomForestClassifier ist ebenfalls vorab geladen.

Diese Übung ist Teil des Kurses

Machine-Learning-Workflows in Python entwerfen

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Split the data into train and test, with 20% as test
X_train, ____, ____, y_test = train_test_split(
  X, y, ____=0.2, random_state=1)
Code bearbeiten und ausführen