Evalueer de trainingsfout
Je gaat nu de RMSE op de trainingset berekenen van de regressieboom dt die je in een eerdere oefening hebt aangemaakt.
Naast dt zijn X_train en y_train beschikbaar in je werkruimte.
Let op: in scikit-learn kun je de MSE van een model als volgt berekenen:
MSE_model = mean_squared_error(y_true, y_predicted)
waarbij we de functie mean_squared_error uit de module metrics gebruiken en de ware labels y_true als eerste argument doorgeven, en de door het model voorspelde labels y_predicted als tweede argument.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in Python
Oefeninstructies
- Importeer
mean_squared_erroralsMSEuitsklearn.metrics. - Fit
dtop de trainingset. - Voorspel de trainingslabels met
dten sla het resultaat op iny_pred_train. - Bereken de RMSE op de trainingset van
dten sla deze op inRMSE_train.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import mean_squared_error from sklearn.metrics as MSE
____
# Fit dt to the training set
____.____(____, ____)
# Predict the labels of the training set
____ = ____.____(____)
# Evaluate the training set RMSE of dt
____ = (____(____, ____))**(___)
# Print RMSE_train
print('Train RMSE: {:.2f}'.format(RMSE_train))