IniziaInizia gratis

RMSE in-sample per la regressione lineare su diamonds

Come hai visto nel video, nel corso è incluso il dataset diamonds, un classico dell'ecosistema ggplot2. Il dataset contiene attributi fisici dei diamanti e il prezzo a cui sono stati venduti. Una sfida di modellazione interessante è prevedere il prezzo dei diamanti in base ai loro attributi usando, per esempio, una regressione lineare.

Ricorda che per adattare una regressione lineare si usa la funzione lm() nel seguente formato:

mod <- lm(y ~ x, my_data)

Per fare previsioni con mod sui dati originali, si usa la funzione predict():

pred <- predict(mod, my_data)

Questo esercizio fa parte del corso

Machine Learning con caret in R

Visualizza il corso

Istruzioni dell'esercizio

  • Adatta un modello lineare sul dataset diamonds per prevedere price usando tutte le altre variabili come predittori (cioè price ~ .). Salva il risultato in model.
  • Fai previsioni con model sull’intero dataset originale e salva il risultato in p.
  • Calcola gli errori usando la formula \(errors = predicted - actual\). Salva il risultato in error.
  • Calcola l’RMSE usando la formula che hai visto nel video e stampala in console.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Fit lm model: model


# Predict on full data: p


# Compute errors: error


# Calculate RMSE
Modifica ed esegui il codice