Voorspel fietsverhuur op nieuwe data
In deze oefening gebruik je het model dat je in de vorige oefening hebt gebouwd om voorspellingen te doen voor de maand augustus. De gegevensset bikesAugust heeft dezelfde kolommen als bikesJuly.
Onthoud dat je type = "response" moet opgeven bij predict() (docs) wanneer je tellingen voorspelt met een glm poisson- of quasipoisson-model.
Het model bike_model en het bikesAugust data frame zijn al voor je geladen.
Deze oefening maakt deel uit van de cursus
Supervised Learning in R: Regressie
Oefeninstructies
- Gebruik
predictom het aantal fietsen per uur te voorspellen op debikesAugust-data. Sla de voorspellingen op in de kolombikesAugust$pred. - Vul de lege plekken in om de RMSE van de voorspellingen op de augustusdata te krijgen.
- Vul de lege plekken in om de grafiek van voorspellingen versus werkelijke tellingen te maken.
- Lijken sommige voorspellingen negatief te zijn?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# bikesAugust is available
str(bikesAugust)
# bike_model is available
summary(bike_model)
# Make predictions on August data
bikesAugust$pred <- ___
# Calculate the RMSE
bikesAugust %>%
mutate(residual = ___) %>%
summarize(rmse = ___)
# Plot predictions vs cnt (pred on x-axis)
ggplot(bikesAugust, aes(x = ___, y = ___)) +
geom_point() +
geom_abline(color = "darkblue")