Bangun model yang lebih baik
Sebelumnya Anda membangun sekumpulan model sederhana untuk memodelkan harapan hidup (life expectancy) menggunakan fitur year. Analisis Anda sebelumnya menunjukkan bahwa sebagian model tersebut tidak cocok dengan baik.
Pada latihan ini Anda akan membangun model regresi berganda untuk setiap negara menggunakan semua fitur yang tersedia. Anda mungkin tertarik membandingkan kinerja empat model dengan kecocokan terburuk, sehingga adjusted \(R^2\)-nya disediakan di bawah ini:
| Country | Adjusted \(R^2\) |
|---|---|
| Botswana | -0.0060772 |
| Lesotho | -0.0169851 |
| Zambia | 0.1668999 |
| Zimbabwe | 0.2083979 |
Latihan ini adalah bagian dari kursus
Machine Learning di Tidyverse
Petunjuk latihan
- Bangun model linear untuk setiap negara yang memprediksi
life_expectancymenggunakan setiap fitur dalam himpunan data. - Tambahkan sebuah kolom (
fit) yang berisi statistik kecocokan untuk setiap model dan sederhanakan data frame ini. - Cetak adjusted \(R^2\) di
fullmodel_perfuntuk empat negara dari data frameworst_fit.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Build a linear model for each country using all features
gap_fullmodel <- gap_nested %>%
mutate(model = map(data, ~lm(formula = ___, data = .x)))
fullmodel_perf <- gap_fullmodel %>%
# Extract the fit statistics of each model into data frames
mutate(fit = map(model, ~___(.x))) %>%
# Simplify the fit data frames for each model
unnest(___)
# View the performance for the four countries with the worst fitting four simple models you looked at before
fullmodel_perf %>%
___(country %in% worst_fit$country) %>%
select(country, adj.r.squared)