LoslegenKostenlos starten

Deine erste Pipeline

Dein Kollege hat AdaBoostClassifier für den Credit-Scoring-Datensatz verwendet. Du möchtest außerdem einen Random-Forest-Klassifikator ausprobieren. In dieser Übung passt du diesen Klassifikator an die Daten an und vergleichst ihn mit AdaBoostClassifier. Achte darauf, Train-/Test-Splitting zu verwenden, um Overfitting zu vermeiden. Die Daten sind vorab geladen und so transformiert, dass alle Features numerisch sind. Die Features liegen als X und die Labels als y vor. Das Modul RandomForestClassifier ist ebenfalls vorab geladen.

Diese Übung ist Teil des Kurses

<Kurs>Machine-Learning-Workflows in Python entwerfen</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Split the data into train and test, with 20% as test
X_train, ____, ____, y_test = train_test_split(
  X, y, ____=0.2, random_state=1)
Code bearbeiten und ausführen