1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning in R: Regression

Connected

Cvičení

Předpovědi z modelu nezaměstnanosti

V tomto cvičení použiješ model nezaměstnanosti unemployment_model k vytvoření předpovědí z dat unemployment a porovnáš předpovězené míry nezaměstnanosti žen se skutečně pozorovanými hodnotami v trénovacích datech unemployment. Model také použiješ k předpovědi na nových datech v newrates, která obsahují jediné pozorování s mírou nezaměstnanosti mužů 5 %.

Rozhraní predict() (docs) pro modely lm má tvar

predict(model, newdata)

Pro vytvoření grafů použiješ balíček ggplot2, takže sloupec s předpověďmi přidáš do datového rámce unemployment. Vykreslíš skutečné hodnoty oproti předpovězeným a porovnáš je s přímkou představující dokonalé předpovědi (tedy situaci, kdy se skutečná hodnota rovná předpovězené).

Příkaz ggplot2 pro vykreslení bodového grafu dframe$outcome oproti dframe$pred (pred na ose x, outcome na ose y) spolu s modrou přímkou, kde outcome == pred, vypadá takto:

ggplot(dframe, aes(x = pred, y = outcome)) + 
       geom_point() +  
       geom_abline(color = "blue")

unemployment, unemployment_model a newrates jsou pro tebe předem načteny.

Pokyny

100 XP
  • Pomocí predict() předpověz míry nezaměstnanosti žen z dat unemployment. Výsledek ulož do nového sloupce: prediction.
  • Pomocí příkazu library() načti balíček ggplot2.
  • Pomocí ggplot() porovnej předpovědi se skutečnými mírami nezaměstnanosti. Předpovědi umísti na osu x. Jak blízko jsou výsledky přímce dokonalé předpovědi?
  • Pomocí datového rámce newrates předpověz očekávanou míru nezaměstnanosti žen při míře nezaměstnanosti mužů 5 %. Výsledek ulož do proměnné pred a vypiš ho.