Prever aluguel de bicicletas com o modelo de random forest
Neste exercício, você vai usar o modelo que ajustou no exercício anterior para prever os aluguéis de bicicletas para o mês de agosto.
A função predict() (docs) para um modelo ranger produz uma
lista. Um dos elementos dessa lista é predictions, um vetor de valores previstos. Você pode acessar predictions com a notação $ para acessar elementos nomeados de uma lista:
predict(model, data)$predictions
O modelo bike_model_rf e o conjunto de dados bikesAugust (para avaliação) já foram pré-carregados.
Este exercício faz parte do curso
Aprendizado Supervisionado em R: Regressão
Instruções do exercício
- Chame
predict()embikesAugustpara prever o número de bicicletas alugadas em agosto (cnt). Adicione as predições abikesAugustcomo a colunapred. - Preencha as lacunas para calcular a raiz do erro quadrático médio (RMSE) das predições.
- O modelo de Poisson que você construiu para estes dados teve um RMSE de cerca de 112,6. Como este modelo se compara?
- Preencha as lacunas para plotar as contagens reais de aluguel de bicicletas (
cnt) versus as predições (predno eixo x).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# bikesAugust is available
str(bikesAugust)
# bike_model_rf is available
bike_model_rf
# Make predictions on the August data
bikesAugust$pred <- ___(___, ___)$___
# Calculate the RMSE of the predictions
bikesAugust %>%
mutate(residual = ___) %>% # calculate the residual
summarize(rmse = ___) # calculate rmse
# Plot actual outcome vs predictions (predictions on x-axis)
ggplot(bikesAugust, aes(x = ___, y = ___)) +
geom_point() +
geom_abline()