IniziaInizia gratis

Prevedi i noleggi di biciclette con il modello random forest

In questo esercizio userai il modello che hai addestrato nell'esercizio precedente per prevedere i noleggi di biciclette per il mese di agosto.

La funzione predict() (docs) per un modello ranger produce una lista. Uno degli elementi di questa lista è predictions, un vettore di valori previsti. Puoi accedere a predictions con la notazione $ per gli elementi con nome di una lista:

predict(model, data)$predictions

Il modello bike_model_rf e l'insieme di dati bikesAugust (per la valutazione) sono già stati caricati.

Questo esercizio fa parte del corso

Supervised Learning in R: Regression

Visualizza il corso

Istruzioni dell'esercizio

  • Chiama predict() su bikesAugust per prevedere il numero di biciclette noleggiate in agosto (cnt). Aggiungi le previsioni a bikesAugust come colonna pred.
  • Compila gli spazi vuoti per calcolare la root mean squared error delle previsioni.
    • Il modello di Poisson che hai costruito per questi dati aveva un RMSE di circa 112,6. Come si comporta questo modello a confronto?
  • Compila gli spazi vuoti per tracciare i conteggi reali dei noleggi di biciclette (cnt) rispetto alle previsioni (pred sull'asse x).

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# bikesAugust is available
str(bikesAugust)

# bike_model_rf is available
bike_model_rf

# Make predictions on the August data
bikesAugust$pred <- ___(___, ___)$___

# Calculate the RMSE of the predictions
bikesAugust %>% 
  mutate(residual = ___)  %>% # calculate the residual
  summarize(rmse  = ___)      # calculate rmse

# Plot actual outcome vs predictions (predictions on x-axis)
ggplot(bikesAugust, aes(x = ___, y = ___)) + 
  geom_point() + 
  geom_abline()
Modifica ed esegui il codice