Aan de slagGa gratis aan de slag

Evalueer het optimale bos

In deze laatste oefening van de cursus ga je de testset-RMSE van het optimale model van grid_rf evalueren.

De gegevensset is al voor je geladen en voorbereid, en is gesplitst in 80% train en 20% test. In je omgeving zijn X_test, y_test en de functie mean_squared_error uit sklearn.metrics beschikbaar onder de alias MSE. Daarnaast hebben we ook het getrainde GridSearchCV-object grid_rf geladen dat je in de vorige oefening hebt aangemaakt. Merk op dat grid_rf als volgt is getraind:

grid_rf.fit(X_train, y_train)

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in Python

Cursus bekijken

Oefeninstructies

  • Importeer mean_squared_error als MSE uit sklearn.metrics.

  • Haal de beste schatter uit grid_rf en wijs die toe aan best_model.

  • Voorspel de testset-labels met best_model en wijs het resultaat toe aan y_pred.

  • Bereken de testset-RMSE van best_model.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import mean_squared_error from sklearn.metrics as MSE 
____

# Extract the best estimator
best_model = ____

# Predict test set labels
y_pred = ____

# Compute rmse_test
rmse_test = ____

# Print rmse_test
print('Test RMSE of best model: {:.3f}'.format(rmse_test)) 
Code bewerken en uitvoeren