Aan de slagGa gratis aan de slag

Voorspel fietsverhuur met het random forest-model

In deze oefening gebruik je het model dat je in de vorige oefening hebt getraind om de fietsverhuur voor de maand augustus te voorspellen.

De functie predict() (docs) voor een ranger-model levert een lijst op. Een van de elementen van deze lijst is predictions, een vector met voorspelde waarden. Je kunt predictions benaderen met de $-notatie voor benoemde elementen van een lijst:

predict(model, data)$predictions

Het model bike_model_rf en de gegevensset bikesAugust (voor evaluatie) zijn al voor je geladen.

Deze oefening maakt deel uit van de cursus

Supervised Learning in R: Regressie

Cursus bekijken

Oefeninstructies

  • Roep predict() aan op bikesAugust om het aantal gehuurde fietsen in augustus (cnt) te voorspellen. Voeg de voorspellingen toe aan bikesAugust als de kolom pred.
  • Vul de lege plekken in om de root mean squared error van de voorspellingen te berekenen.
    • Het poisson-model dat je voor deze data hebt gebouwd gaf een RMSE van ongeveer 112,6. Hoe verhoudt dit model zich?
  • Vul de lege plekken in om de werkelijke aantallen fietsverhuur (cnt) uit te zetten tegen de voorspellingen (pred op de x-as).

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# bikesAugust is available
str(bikesAugust)

# bike_model_rf is available
bike_model_rf

# Make predictions on the August data
bikesAugust$pred <- ___(___, ___)$___

# Calculate the RMSE of the predictions
bikesAugust %>% 
  mutate(residual = ___)  %>% # calculate the residual
  summarize(rmse  = ___)      # calculate rmse

# Plot actual outcome vs predictions (predictions on x-axis)
ggplot(bikesAugust, aes(x = ___, y = ___)) + 
  geom_point() + 
  geom_abline()
Code bewerken en uitvoeren