Visualiseer voorspellingen van het random forest-fietsmodel
In de vorige oefening zag je dat het random forest-fietsmodel beter presteerde op de augustusdata dan het quasipoisson-model, gemeten met RMSE.
In deze oefening visualiseer je de augustusvoorspellingen van het random forest-model als functie van de tijd. De bijbehorende plot van het quasipoisson-model dat je eerder bouwde is beschikbaar om te vergelijken.
Onthoud dat het quasipoisson-model vooral het patroon van rustige en drukke uren op de dag oppikte, maar piekvraag enigszins onderschatte. Je wilt zien hoe het random forest-model daarop scoort.
De data frame bikesAugust (met voorspellingen) is voor je beschikbaar gesteld. De plot quasipoisson_plot met quasipoisson-voorspellingen als functie van de tijd wordt getoond.
Deze oefening maakt deel uit van de cursus
Supervised Learning in R: Regressie
Oefeninstructies
- Vul de lege plekken in om de voorspellingen en daadwerkelijke tellingen per uur voor de eerste 14 dagen van augustus te plotten.
pivot_longerde kolommencntenprednaar één kolomvalue, met een sleutelvaluetype.- Plot
valueals functie vaninstant(dag).
Hoe verhoudt het random forest-model zich?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
first_two_weeks <- bikesAugust %>%
mutate(rf = bike_outcomesAugust$rf) %>%
# Set start to 0, convert unit to days
mutate(instant = (instant - min(instant)) / 24) %>%
# Filter for rows in the first two weeks
filter(instant < 14)
# collect cnt and pred into a column named value with key valuetype
pivot_longer(c('cnt', 'rf'), names_to = '___', values_to = '___')
# Plot predictions and cnt by date/time
ggplot(___, aes(x = ___, y = ___, color = valuetype, linetype = valuetype)) +
geom_point() +
geom_line() +
scale_x_continuous("Day", breaks = 0:14, labels = 0:14) +
scale_color_brewer(palette = "Dark2") +
ggtitle("Predicted August bike rentals, Random Forest plot")