Visualisasikan prediksi model random forest untuk sepeda
Pada latihan sebelumnya, Anda melihat bahwa model random forest untuk sepeda memiliki kinerja lebih baik pada data Agustus dibandingkan model quasipoisson, diukur dengan RMSE.
Pada latihan ini, Anda akan memvisualisasikan prediksi bulan Agustus dari model random forest sebagai fungsi waktu. Plot yang sesuai dari model quasipoisson yang Anda bangun pada latihan sebelumnya tersedia untuk Anda bandingkan.
Ingat bahwa model quasipoisson terutama mengenali pola jam sepi dan sibuk dalam sehari, tetapi agak meremehkan permintaan puncak. Anda ingin melihat bagaimana perbandingan model random forest.
Data frame bikesAugust (dengan prediksi) telah disediakan untuk Anda. Plot quasipoisson_plot dari prediksi model quasipoisson sebagai fungsi waktu ditampilkan.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Regresi
Petunjuk latihan
- Lengkapi bagian kosong untuk memplot prediksi dan jumlah aktual per jam untuk 14 hari pertama bulan Agustus.
pivot_longerkolomcntdanpredmenjadi sebuah kolom bernamavalue, dengan key bernamavaluetype.- Plot
valuesebagai fungsi dariinstant(hari).
Bagaimana perbandingan model random forest?
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
first_two_weeks <- bikesAugust %>%
mutate(rf = bike_outcomesAugust$rf) %>%
# Set start to 0, convert unit to days
mutate(instant = (instant - min(instant)) / 24) %>%
# Filter for rows in the first two weeks
filter(instant < 14)
# collect cnt and pred into a column named value with key valuetype
pivot_longer(c('cnt', 'rf'), names_to = '___', values_to = '___')
# Plot predictions and cnt by date/time
ggplot(___, aes(x = ___, y = ___, color = valuetype, linetype = valuetype)) +
geom_point() +
geom_line() +
scale_x_continuous("Day", breaks = 0:14, labels = 0:14) +
scale_color_brewer(palette = "Dark2") +
ggtitle("Predicted August bike rentals, Random Forest plot")