Deine erste Pipeline
Dein Kollege hat AdaBoostClassifier für den Credit-Scoring-Datensatz verwendet. Du möchtest außerdem einen Random-Forest-Klassifikator ausprobieren. In dieser Übung passt du diesen Klassifikator an die Daten an und vergleichst ihn mit AdaBoostClassifier. Achte darauf, Train-/Test-Splitting zu verwenden, um Overfitting zu vermeiden. Die Daten sind vorab geladen und so transformiert, dass alle Features numerisch sind. Die Features liegen als X und die Labels als y vor. Das Modul RandomForestClassifier ist ebenfalls vorab geladen.
Diese Übung ist Teil des Kurses
Machine-Learning-Workflows in Python entwerfen
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Split the data into train and test, with 20% as test
X_train, ____, ____, y_test = train_test_split(
X, y, ____=0.2, random_state=1)