Aan de slagGa gratis aan de slag

Evalueer de trainingsfout

Je gaat nu de RMSE op de trainingset berekenen van de regressieboom dt die je in een eerdere oefening hebt aangemaakt.

Naast dt zijn X_train en y_train beschikbaar in je werkruimte.

Let op: in scikit-learn kun je de MSE van een model als volgt berekenen:

MSE_model = mean_squared_error(y_true, y_predicted)

waarbij we de functie mean_squared_error uit de module metrics gebruiken en de ware labels y_true als eerste argument doorgeven, en de door het model voorspelde labels y_predicted als tweede argument.

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in Python

Cursus bekijken

Oefeninstructies

  • Importeer mean_squared_error als MSE uit sklearn.metrics.
  • Fit dt op de trainingset.
  • Voorspel de trainingslabels met dt en sla het resultaat op in y_pred_train.
  • Bereken de RMSE op de trainingset van dt en sla deze op in RMSE_train.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import mean_squared_error from sklearn.metrics as MSE
____

# Fit dt to the training set
____.____(____, ____)

# Predict the labels of the training set
____ = ____.____(____)

# Evaluate the training set RMSE of dt
____ = (____(____, ____))**(___)

# Print RMSE_train
print('Train RMSE: {:.2f}'.format(RMSE_train))
Code bewerken en uitvoeren