RMSE in-sample per la regressione lineare su diamonds
Come hai visto nel video, nel corso è incluso il dataset diamonds, un classico dell'ecosistema ggplot2. Il dataset contiene attributi fisici dei diamanti e il prezzo a cui sono stati venduti. Una sfida di modellazione interessante è prevedere il prezzo dei diamanti in base ai loro attributi usando, per esempio, una regressione lineare.
Ricorda che per adattare una regressione lineare si usa la funzione lm() nel seguente formato:
mod <- lm(y ~ x, my_data)
Per fare previsioni con mod sui dati originali, si usa la funzione predict():
pred <- predict(mod, my_data)
Questo esercizio fa parte del corso
Machine Learning con caret in R
Istruzioni dell'esercizio
- Adatta un modello lineare sul dataset
diamondsper prevederepriceusando tutte le altre variabili come predittori (cioèprice ~ .). Salva il risultato inmodel. - Fai previsioni con
modelsull’intero dataset originale e salva il risultato inp. - Calcola gli errori usando la formula \(errors = predicted - actual\). Salva il risultato in
error. - Calcola l’RMSE usando la formula che hai visto nel video e stampala in console.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fit lm model: model
# Predict on full data: p
# Compute errors: error
# Calculate RMSE