Evalueer het optimale bos
In deze laatste oefening van de cursus ga je de testset-RMSE van het optimale model van grid_rf evalueren.
De gegevensset is al voor je geladen en voorbereid, en is gesplitst in 80% train en 20% test. In je omgeving zijn X_test, y_test en de functie mean_squared_error uit sklearn.metrics beschikbaar onder de alias MSE. Daarnaast hebben we ook het getrainde GridSearchCV-object grid_rf geladen dat je in de vorige oefening hebt aangemaakt. Merk op dat grid_rf als volgt is getraind:
grid_rf.fit(X_train, y_train)
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in Python
Oefeninstructies
Importeer
mean_squared_erroralsMSEuitsklearn.metrics.Haal de beste schatter uit
grid_rfen wijs die toe aanbest_model.Voorspel de testset-labels met
best_modelen wijs het resultaat toe aany_pred.Bereken de testset-RMSE van
best_model.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import mean_squared_error from sklearn.metrics as MSE
____
# Extract the best estimator
best_model = ____
# Predict test set labels
y_pred = ____
# Compute rmse_test
rmse_test = ____
# Print rmse_test
print('Test RMSE of best model: {:.3f}'.format(rmse_test))