Calcolare l'RMSE
In questo esercizio calcolerai l'RMSE del tuo modello sulla disoccupazione. Negli esercizi di codice precedenti,
hai aggiunto due colonne all'insieme di dati unemployment:
- le previsioni del modello (colonna
predictions) - i residui tra previsioni ed esito (colonna
residuals)
Puoi calcolare l'RMSE a partire da un vettore di residui, \(res\), come:
$$ RMSE = \sqrt{\operatorname{mean}(res^2)} $$
Vuoi che l'RMSE sia piccolo. Quanto piccolo è "piccolo"? Una regola pratica è confrontare l'RMSE con la deviazione standard dell'esito. Con un buon modello, l'RMSE dovrebbe essere più basso.
Il data frame unemployment è già stato caricato per te.
Questo esercizio fa parte del corso
Supervised Learning in R: Regression
Istruzioni dell'esercizio
- Rivedi i dati
unemploymentdall'esercizio precedente. - Per comodità, assegna la colonna
residualsdiunemploymentalla variabileres. - Calcola l'RMSE: eleva
resal quadrato, fanne la media e poi la radice quadrata. Assegna il risultato alla variabilermsee stampala.- Suggerimento: puoi farlo in un solo passaggio racchiudendo l'assegnazione tra parentesi:
(rmse <- ___)
- Suggerimento: puoi farlo in un solo passaggio racchiudendo l'assegnazione tra parentesi:
- Calcola la deviazione standard di
female_unemploymente assegnala alla variabilesd_unemployment. Stampala. Come si confronta l'RMSE del modello con la deviazione standard dei dati?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print a summary of unemployment
summary(unemployment)
# For convenience put the residuals in the variable res
res <- ___
# Calculate RMSE, assign it to the variable rmse and print it
(rmse <- ___)
# Calculate the standard deviation of female_unemployment and print it
(sd_unemployment <- ___)