MulaiMulai sekarang secara gratis

Bangun model yang lebih baik

Sebelumnya Anda membangun sekumpulan model sederhana untuk memodelkan harapan hidup (life expectancy) menggunakan fitur year. Analisis Anda sebelumnya menunjukkan bahwa sebagian model tersebut tidak cocok dengan baik.

Pada latihan ini Anda akan membangun model regresi berganda untuk setiap negara menggunakan semua fitur yang tersedia. Anda mungkin tertarik membandingkan kinerja empat model dengan kecocokan terburuk, sehingga adjusted \(R^2\)-nya disediakan di bawah ini:

Country Adjusted \(R^2\)
Botswana -0.0060772
Lesotho -0.0169851
Zambia 0.1668999
Zimbabwe 0.2083979

Latihan ini adalah bagian dari kursus

Machine Learning di Tidyverse

Lihat Kursus

Petunjuk latihan

  • Bangun model linear untuk setiap negara yang memprediksi life_expectancy menggunakan setiap fitur dalam himpunan data.
  • Tambahkan sebuah kolom (fit) yang berisi statistik kecocokan untuk setiap model dan sederhanakan data frame ini.
  • Cetak adjusted \(R^2\) di fullmodel_perf untuk empat negara dari data frame worst_fit.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Build a linear model for each country using all features
gap_fullmodel <- gap_nested %>% 
  mutate(model = map(data, ~lm(formula = ___, data = .x)))

fullmodel_perf <- gap_fullmodel %>% 
  # Extract the fit statistics of each model into data frames
  mutate(fit = map(model, ~___(.x))) %>% 
  # Simplify the fit data frames for each model
  unnest(___)
  
# View the performance for the four countries with the worst fitting four simple models you looked at before
fullmodel_perf %>% 
  ___(country %in% worst_fit$country) %>% 
  select(country, adj.r.squared)
Edit dan Jalankan Kode