1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning in R: Regression

Connected

Cvičení

Vyhodnocení modelu pomocí rozdělení na trénovací a testovací data

Teď otestuješ model mpg_model na testovacích datech mpg_test. Pro výpočet RMSE a R-squared jsou k dispozici tyto funkce:

rmse(predcol, ycol)
r_squared(predcol, ycol)

kde:

  • predcol: predikované hodnoty
  • ycol: skutečný výsledek

Dále vykreslíš predikce oproti skutečným hodnotám.

Výkonnost modelu bývá obecně lepší na trénovacích datech než na testovacích (i když testovací sada občas „vyjde lépe"). Mírný rozdíl ve výkonnosti je v pořádku – pokud je ale výkonnost na trénovacích datech výrazně lepší, jde o problém.

Dataové rámce mpg_train a mpg_test, model mpg_model a funkce rmse() a r_squared() jsou předem načteny.

Pokyny

100 XP
  • Predikuj spotřebu paliva ve městě z proměnné hwy pro data mpg_train. Predikce ulož do sloupce pred.
  • Predikuj spotřebu paliva ve městě z proměnné hwy pro data mpg_test. Predikce ulož do sloupce pred.
  • Pomocí rmse() vyhodnoť RMSE pro testovací i trénovací sadu. Porovnej výsledky – jsou si výkonnosti podobné?
  • Totéž proveď s r_squared(). Jsou si výkonnosti podobné?
  • Pomocí ggplot2 vykresli predikce oproti cty na testovacích datech.