Prediksi penyewaan sepeda dengan model random forest
Dalam latihan ini, Anda akan menggunakan model yang telah Anda latih pada latihan sebelumnya untuk memprediksi penyewaan sepeda untuk bulan Agustus.
Fungsi predict() (docs) untuk model ranger menghasilkan sebuah
list. Salah satu elemen list ini adalah predictions, yaitu vektor berisi nilai prediksi. Anda dapat mengakses predictions dengan notasi $ untuk mengakses elemen bernama dari sebuah list:
predict(model, data)$predictions
Model bike_model_rf dan himpunan data bikesAugust (untuk evaluasi) sudah dimuat sebelumnya.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Regresi
Petunjuk latihan
- Panggil
predict()padabikesAugustuntuk memprediksi jumlah sepeda yang disewa pada bulan Agustus (cnt). Tambahkan prediksi kebikesAugustsebagai kolompred. - Lengkapi bagian kosong untuk menghitung root mean squared error dari prediksi.
- Model Poisson yang Anda bangun untuk data ini memberikan RMSE sekitar 112,6. Bagaimana perbandingan model ini?
- Lengkapi bagian kosong untuk memplot jumlah penyewaan sepeda aktual (
cnt) versus prediksi (pred pada sumbu x).
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# bikesAugust is available
str(bikesAugust)
# bike_model_rf is available
bike_model_rf
# Make predictions on the August data
bikesAugust$pred <- ___(___, ___)$___
# Calculate the RMSE of the predictions
bikesAugust %>%
mutate(residual = ___) %>% # calculate the residual
summarize(rmse = ___) # calculate rmse
# Plot actual outcome vs predictions (predictions on x-axis)
ggplot(bikesAugust, aes(x = ___, y = ___)) +
geom_point() +
geom_abline()