Visualizza il modello xgboost per il noleggio bici
Hai visto tre modi diversi per modellare i dati di noleggio bici. In questo esempio, hai visto che il modello di gradient boosting ha avuto il RMSE più basso. Per concludere il corso, confrontiamo le previsioni del modello di gradient boosting con gli altri due modelli in funzione del tempo.
Completando questo esercizio, avrai terminato il corso. Congratulazioni! Ora hai gli strumenti per applicare varie strategie ai tuoi compiti di regressione.
Il data frame bikesAugust con le previsioni è già caricato. I grafici quasipoisson_plot e randomforest_plot sono anche disponibili.
Questo esercizio fa parte del corso
Supervised Learning in R: Regression
Istruzioni dell'esercizio
- Stampa
quasipoisson_plotper rivedere il comportamento del modello quasi-poisson. - Stampa
randomforest_plotper rivedere il comportamento del modello random forest. - Compila gli spazi vuoti per tracciare le previsioni del gradient boosting e i conteggi effettivi per ora per i primi 14 giorni di agosto.
- Usa
pivot_longer()per trasformare i nomi delle colonnecntegbmin una colonna chiamatavalue, con una chiave chiamatavaluetype. - Traccia
valuein funzione diinstant(giorno).
- Usa
Come si confronta il modello di gradient boosting con i modelli precedenti?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print quasipoisson_plot
___
# Print randomforest_plot
___
# Plot predictions and actual bike rentals as a function of time (days)
bikesAugust %>%
mutate(instant = (instant - min(instant))/24) %>% # set start to 0, convert unit to days
filter(instant < 14) %>% # first two weeks
pivot_longer(c(___, ___), names_to = ___, values_to = ___) %>%
ggplot(aes(x = ___, y = ___, color = valuetype, linetype = valuetype)) +
geom_point() +
geom_line() +
scale_x_continuous("Day", breaks = 0:14, labels = 0:14) +
scale_color_brewer(palette = "Dark2") +
ggtitle("Predicted August bike rentals, Gradient Boosting model")