Visualizar previsões do modelo de random forest para bicicletas
No exercício anterior, você viu que o modelo de random forest para bicicletas teve melhor desempenho nos dados de agosto do que o modelo quasipoisson, em termos de RMSE.
Neste exercício, você vai visualizar as previsões de agosto do modelo de random forest em função do tempo. O gráfico correspondente do modelo quasipoisson que você construiu em um exercício anterior está disponível para comparação.
Lembre-se de que o modelo quasipoisson identificou principalmente o padrão de horas mais lentas e mais movimentadas do dia, mas subestimou um pouco os picos de demanda. Você quer ver como o modelo de random forest se compara.
O data frame bikesAugust (com previsões) foi disponibilizado para você. O gráfico quasipoisson_plot das previsões do modelo quasipoisson em função do tempo é exibido.
Este exercício faz parte do curso
Aprendizado Supervisionado em R: Regressão
Instruções do exercício
- Preencha os espaços em branco para plotar as previsões e as contagens reais por hora para os primeiros 14 dias de agosto.
- Use
pivot_longernas colunascntepredpara uma coluna chamadavalue, com uma chave chamadavaluetype. - Plote
valueem função deinstant(dia).
- Use
Como o modelo de random forest se compara?
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
first_two_weeks <- bikesAugust %>%
mutate(rf = bike_outcomesAugust$rf) %>%
# Set start to 0, convert unit to days
mutate(instant = (instant - min(instant)) / 24) %>%
# Filter for rows in the first two weeks
filter(instant < 14)
# collect cnt and pred into a column named value with key valuetype
pivot_longer(c('cnt', 'rf'), names_to = '___', values_to = '___')
# Plot predictions and cnt by date/time
ggplot(___, aes(x = ___, y = ___, color = valuetype, linetype = valuetype)) +
geom_point() +
geom_line() +
scale_x_continuous("Day", breaks = 0:14, labels = 0:14) +
scale_color_brewer(palette = "Dark2") +
ggtitle("Predicted August bike rentals, Random Forest plot")