Daha iyi modeller kur
Daha önce year özelliğini kullanarak life expectancy için basit modellerden oluşan bir koleksiyon kurmuştun. Önceki analizinde bu modellerin bazılarının pek iyi uymadığını görmüştün.
Bu egzersizde her ülke için mevcut tüm özellikleri kullanarak çoklu regresyon modelleri kuracaksın. En kötü uyuma sahip dört modelin performansını karşılaştırmak isteyebilirsin; bu yüzden düzeltilmiş \(R^2\) değerleri aşağıda verilmiştir:
| Country | Adjusted \(R^2\) |
|---|---|
| Botswana | -0.0060772 |
| Lesotho | -0.0169851 |
| Zambia | 0.1668999 |
| Zimbabwe | 0.2083979 |
Bu egzersiz
Tidyverse ile Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Veri kümesindeki tüm özellikleri kullanarak her ülke için
life_expectancy'yi tahmin eden bir doğrusal model kur. - Her model için uyum istatistiklerini içeren bir sütunu (
fit) ekle ve bu veri çerçevesini basitleştir. worst_fitveri çerçevesindeki dört ülkenin düzeltilmiş \(R^2\) değerlerinifullmodel_perfiçinde yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Build a linear model for each country using all features
gap_fullmodel <- gap_nested %>%
mutate(model = map(data, ~lm(formula = ___, data = .x)))
fullmodel_perf <- gap_fullmodel %>%
# Extract the fit statistics of each model into data frames
mutate(fit = map(model, ~___(.x))) %>%
# Simplify the fit data frames for each model
unnest(___)
# View the performance for the four countries with the worst fitting four simple models you looked at before
fullmodel_perf %>%
___(country %in% worst_fit$country) %>%
select(country, adj.r.squared)