Aan de slagGa gratis aan de slag

Evalueer de 10-voudige CV-fout

In deze oefening evalueer je de 10-voudige CV Root Mean Squared Error (RMSE) behaald door de regressieboom dt die je in de vorige oefening hebt aangemaakt.

Naast dt zijn ook de trainingsgegevens X_train en y_train beschikbaar in je werkruimte. We hebben ook cross_val_score uit sklearn.model_selection geïmporteerd.

Let op: omdat cross_val_score alleen de mogelijkheid heeft om negatieve MSE’s te evalueren, moet de uitvoer met min één worden vermenigvuldigd om de MSE’s te krijgen. De CV-RMSE kun je vervolgens verkrijgen door de vierkantswortel van de gemiddelde MSE te nemen.

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in Python

Cursus bekijken

Oefeninstructies

  • Bereken de 10-voudig cross-gevalideerde MSE van dt door het argument scoring in te stellen op 'neg_mean_squared_error'.

  • Bereken de RMSE op basis van de verkregen MSE-scores.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Compute the array containing the 10-folds CV MSEs
MSE_CV_scores = - ____(____, ____, ____, cv=____, 
                       ____='____',
                       n_jobs=-1)

# Compute the 10-folds CV RMSE
RMSE_CV = (____.____)**(____)

# Print RMSE_CV
print('CV RMSE: {:.2f}'.format(RMSE_CV))
Code bewerken en uitvoeren