ComeçarComece de graça

Prever aluguel de bicicletas com o modelo de random forest

Neste exercício, você vai usar o modelo que ajustou no exercício anterior para prever os aluguéis de bicicletas para o mês de agosto.

A função predict() (docs) para um modelo ranger produz uma lista. Um dos elementos dessa lista é predictions, um vetor de valores previstos. Você pode acessar predictions com a notação $ para acessar elementos nomeados de uma lista:

predict(model, data)$predictions

O modelo bike_model_rf e o conjunto de dados bikesAugust (para avaliação) já foram pré-carregados.

Este exercício faz parte do curso

Aprendizado Supervisionado em R: Regressão

Ver curso

Instruções do exercício

  • Chame predict() em bikesAugust para prever o número de bicicletas alugadas em agosto (cnt). Adicione as predições a bikesAugust como a coluna pred.
  • Preencha as lacunas para calcular a raiz do erro quadrático médio (RMSE) das predições.
    • O modelo de Poisson que você construiu para estes dados teve um RMSE de cerca de 112,6. Como este modelo se compara?
  • Preencha as lacunas para plotar as contagens reais de aluguel de bicicletas (cnt) versus as predições (pred no eixo x).

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# bikesAugust is available
str(bikesAugust)

# bike_model_rf is available
bike_model_rf

# Make predictions on the August data
bikesAugust$pred <- ___(___, ___)$___

# Calculate the RMSE of the predictions
bikesAugust %>% 
  mutate(residual = ___)  %>% # calculate the residual
  summarize(rmse  = ___)      # calculate rmse

# Plot actual outcome vs predictions (predictions on x-axis)
ggplot(bikesAugust, aes(x = ___, y = ___)) + 
  geom_point() + 
  geom_abline()
Editar e executar o código