Model dengan kecocokan terbaik dan terburuk
Dalam latihan ini Anda akan menjawab pertanyaan berikut:
- Secara keseluruhan, seberapa baik model Anda menyesuaikan data?
- Model mana yang memiliki kecocokan terbaik?
- Model mana yang tidak sesuai dengan data dengan baik?
Latihan ini adalah bagian dari kursus
Machine Learning di Tidyverse
Petunjuk latihan
- Buat plot histogram nilai \(R^2\) dari 77 model
- Ekstrak 4 model dengan kecocokan terbaik (berdasarkan \(R^2\)) dan simpan kerangka data ini sebagai
best_fit - Ekstrak 4 model dengan kecocokan terburuk (berdasarkan \(R^2\)) dan simpan kerangka data ini sebagai
worst_fit
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Plot a histogram of rsquared for the 77 models
model_perf %>%
ggplot(aes(x = ___)) +
___()
# Extract the 4 best fitting models
best_fit <- model_perf %>%
slice_max(___, n = ___)
# Extract the 4 models with the worst fit
worst_fit <- model_perf %>%
slice_min(___, n = ___)