1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning in R: Regression

Connected

Cvičení

Výpočet RMSE

V tomto cvičení vypočítáš RMSE svého modelu nezaměstnanosti. V předchozích cvičeních jsi do datového rámce unemployment přidal/a dva sloupce:

  • predikce modelu (sloupec predictions)
  • reziduály mezi predikcemi a skutečnými hodnotami (sloupec residuals)

RMSE lze vypočítat z vektoru reziduálů \(res\) podle vzorce:

$$ RMSE = \sqrt{\operatorname{mean}(res^2)} $$

Chceš, aby bylo RMSE co nejmenší. Jak poznat, jestli je dostatečně malé? Jedna praktická pomůcka je porovnat RMSE se směrodatnou odchylkou výstupní proměnné. U dobrého modelu by mělo být RMSE menší.

Dataový rámec unemployment je už načtený.

Pokyny

100 XP
  • Prohlédni si data unemployment z předchozího cvičení.
  • Pro přehlednost přiřaď sloupec residuals z unemployment do proměnné res.
  • Vypočítej RMSE: umocni res, spočítej průměr a výsledek odmocni. Výsledek přiřaď do proměnné rmse a vypiš ho.
    • Tip: celý postup zvládneš v jednom kroku tak, že přiřazení obalíš závorkami: (rmse <- ___)
  • Vypočítej směrodatnou odchylku female_unemployment a přiřaď ji do proměnné sd_unemployment. Vypiš ji. Jak se RMSE modelu porovnává se směrodatnou odchylkou dat?