Daha iyi modeller kur
Daha önce year özelliğini kullanarak life expectancy için basit modellerden oluşan bir koleksiyon kurmuştun. Önceki analizinde bu modellerin bazılarının pek iyi uymadığını görmüştün.
Bu egzersizde her ülke için mevcut tüm özellikleri kullanarak çoklu regresyon modelleri kuracaksın. En kötü uyuma sahip dört modelin performansını karşılaştırmak isteyebilirsin; bu yüzden düzeltilmiş \(R^2\) değerleri aşağıda verilmiştir:
| Country | Adjusted \(R^2\) |
|---|---|
| Botswana | -0.0060772 |
| Lesotho | -0.0169851 |
| Zambia | 0.1668999 |
| Zimbabwe | 0.2083979 |
Bu egzersiz, kursun bir parçasıdır
Tidyverse ile Machine Learning
Egzersiz talimatları
- Veri kümesindeki tüm özellikleri kullanarak her ülke için
life_expectancy'yi tahmin eden bir doğrusal model kur. - Her model için uyum istatistiklerini içeren bir sütunu (
fit) ekle ve bu veri çerçevesini basitleştir. worst_fitveri çerçevesindeki dört ülkenin düzeltilmiş \(R^2\) değerlerinifullmodel_perfiçinde yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Build a linear model for each country using all features
gap_fullmodel <- gap_nested %>%
mutate(model = map(data, ~lm(formula = ___, data = .x)))
fullmodel_perf <- gap_fullmodel %>%
# Extract the fit statistics of each model into data frames
mutate(fit = map(model, ~___(.x))) %>%
# Simplify the fit data frames for each model
unnest(___)
# View the performance for the four countries with the worst fitting four simple models you looked at before
fullmodel_perf %>%
___(country %in% worst_fit$country) %>%
select(country, adj.r.squared)