Visualize o modelo de aluguel de bicicletas com xgboost
Você viu três maneiras diferentes de modelar os dados de aluguel de bicicletas. Neste exemplo, vimos que o modelo de gradient boosting teve o menor RMSE. Para concluir o curso, vamos comparar as previsões do modelo de gradient boosting com as de outros dois modelos em função do tempo.
Ao finalizar este exercício, você terá concluído o curso. Parabéns! Agora você tem as ferramentas para aplicar várias abordagens às suas tarefas de regressão.
O data frame bikesAugust com as previsões já foi pré-carregado. Os gráficos quasipoisson_plot e randomforest_plot também estão disponíveis.
Este exercício faz parte do curso
Aprendizado Supervisionado em R: Regressão
Instruções do exercício
- Imprima
quasipoisson_plotpara revisar o comportamento do modelo quasipoisson. - Imprima
randomforest_plotpara revisar o comportamento do modelo random forest. - Preencha os espaços em branco para plotar as previsões do gradient boosting e as contagens reais por hora para os primeiros 14 dias de agosto.
- Use
pivot_longer()para transformar os nomes das colunascntegbmem uma coluna chamadavalue, com a chave chamadavaluetype. - Plote
valueem função deinstant(dia).
- Use
Como o modelo de gradient boosting se compara aos modelos anteriores?
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print quasipoisson_plot
___
# Print randomforest_plot
___
# Plot predictions and actual bike rentals as a function of time (days)
bikesAugust %>%
mutate(instant = (instant - min(instant))/24) %>% # set start to 0, convert unit to days
filter(instant < 14) %>% # first two weeks
pivot_longer(c(___, ___), names_to = ___, values_to = ___) %>%
ggplot(aes(x = ___, y = ___, color = valuetype, linetype = valuetype)) +
geom_point() +
geom_line() +
scale_x_continuous("Day", breaks = 0:14, labels = 0:14) +
scale_color_brewer(palette = "Dark2") +
ggtitle("Predicted August bike rentals, Gradient Boosting model")