Voorspel fietsverhuur met het random forest-model
In deze oefening gebruik je het model dat je in de vorige oefening hebt getraind om de fietsverhuur voor de maand augustus te voorspellen.
De functie predict() (docs) voor een ranger-model levert een lijst op. Een van de elementen van deze lijst is predictions, een vector met voorspelde waarden. Je kunt predictions benaderen met de $-notatie voor benoemde elementen van een lijst:
predict(model, data)$predictions
Het model bike_model_rf en de gegevensset bikesAugust (voor evaluatie) zijn al voor je geladen.
Deze oefening maakt deel uit van de cursus
Supervised Learning in R: Regressie
Oefeninstructies
- Roep
predict()aan opbikesAugustom het aantal gehuurde fietsen in augustus (cnt) te voorspellen. Voeg de voorspellingen toe aanbikesAugustals de kolompred. - Vul de lege plekken in om de root mean squared error van de voorspellingen te berekenen.
- Het poisson-model dat je voor deze data hebt gebouwd gaf een RMSE van ongeveer 112,6. Hoe verhoudt dit model zich?
- Vul de lege plekken in om de werkelijke aantallen fietsverhuur (
cnt) uit te zetten tegen de voorspellingen (predop de x-as).
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# bikesAugust is available
str(bikesAugust)
# bike_model_rf is available
bike_model_rf
# Make predictions on the August data
bikesAugust$pred <- ___(___, ___)$___
# Calculate the RMSE of the predictions
bikesAugust %>%
mutate(residual = ___) %>% # calculate the residual
summarize(rmse = ___) # calculate rmse
# Plot actual outcome vs predictions (predictions on x-axis)
ggplot(bikesAugust, aes(x = ___, y = ___)) +
geom_point() +
geom_abline()