1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning in R: Regression

Connected

Cvičení

Relativní chyba

V tomto cvičení porovnáš relativní chybu s absolutní chybou. Pro účely modelování definujeme relativní chybu takto:

$$ rel = \frac{(y - pred)}{y} $$

čili chyba je vyjádřena ve vztahu ke skutečné hodnotě. Celkovou relativní chybu modelu budeme měřit pomocí relativní střední kvadratické chyby:

$$ rmse_{rel} = \sqrt(\overline{rel^2}) $$

kde \(\overline{rel^2}\) je průměr hodnot \(rel^2\).

Ukázkový dataset fdata je již načtený. Obsahuje tyto sloupce:

  • y: skutečná výstupní hodnota, kterou má model předpovědět; představ si, že jde o částku, kterou zákazník utratí při návštěvě tvého obchodu.
  • pred: předpovědi modelu pro y.
  • label: kategorická proměnná: říká, zda hodnota y pochází z populace zákazníků s small (malými) nebo large (velkými) nákupy.

Chceš zjistit, který model funguje „lépe": ten, který předpovídá small nákupy, nebo ten pro large nákupy.

Pokyny

100 XP
  • Doplň chybějící části kódu a prozkoumej data. Všimni si, že velké nákupy bývají přibližně 100× větší než malé.
  • Doplň chybějící části kódu a vytvoř sloupce s chybami:
    • Definuj reziduál jako y - pred.
    • Definuj relativní chybu jako residual / y.
  • Doplň chybějící části kódu, spočítej RMSE a relativní RMSE a porovnej je.
    • Jak se liší absolutní chyby? A relativní chyby?
  • Prohlédni si graf předpovědí oproti skutečným hodnotám.
    • Který model podle tebe funguje „lépe"?