Je eerste pipeline
Je collega heeft AdaBoostClassifier gebruikt voor de kredietbeoordelingsgegevensset. Jij wilt ook een random forest-classifier uitproberen. In deze oefening pas je deze classifier toe op de data en vergelijk je hem met AdaBoostClassifier. Zorg dat je de data opsplitst in train/test om overfitting te voorkomen. De data is al geladen en zo getransformeerd dat alle features numeriek zijn. De features staan in X en de labels in y. De module RandomForestClassifier is ook al geladen.
Deze oefening maakt deel uit van de cursus
Machine Learning-workflows ontwerpen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Split the data into train and test, with 20% as test
X_train, ____, ____, y_test = train_test_split(
X, y, ____=0.2, random_state=1)