Prevedi i noleggi di biciclette con il modello random forest
In questo esercizio userai il modello che hai addestrato nell'esercizio precedente per prevedere i noleggi di biciclette per il mese di agosto.
La funzione predict() (docs) per un modello ranger produce una
lista. Uno degli elementi di questa lista è predictions, un vettore di valori previsti. Puoi accedere a predictions con la notazione $ per gli elementi con nome di una lista:
predict(model, data)$predictions
Il modello bike_model_rf e l'insieme di dati bikesAugust (per la valutazione) sono già stati caricati.
Questo esercizio fa parte del corso
Supervised Learning in R: Regression
Istruzioni dell'esercizio
- Chiama
predict()subikesAugustper prevedere il numero di biciclette noleggiate in agosto (cnt). Aggiungi le previsioni abikesAugustcome colonnapred. - Compila gli spazi vuoti per calcolare la root mean squared error delle previsioni.
- Il modello di Poisson che hai costruito per questi dati aveva un RMSE di circa 112,6. Come si comporta questo modello a confronto?
- Compila gli spazi vuoti per tracciare i conteggi reali dei noleggi di biciclette (
cnt) rispetto alle previsioni (predsull'asse x).
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# bikesAugust is available
str(bikesAugust)
# bike_model_rf is available
bike_model_rf
# Make predictions on the August data
bikesAugust$pred <- ___(___, ___)$___
# Calculate the RMSE of the predictions
bikesAugust %>%
mutate(residual = ___) %>% # calculate the residual
summarize(rmse = ___) # calculate rmse
# Plot actual outcome vs predictions (predictions on x-axis)
ggplot(bikesAugust, aes(x = ___, y = ___)) +
geom_point() +
geom_abline()