1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z modelami drzewiastymi w R

Connected

ćwiczenie

Większy błąd, większa kara

Każdy błąd jest zły, ale nie wszystkie są równie groźne. Duże błędy predykcji bywają nieproporcjonalnie bardziej szkodliwe niż małe.

Większy błąd, większa kara – to jedna z cech pierwiastka błędu średniokwadratowego, czyli RMSE. Miarę tę oblicza się, podnosząc błędy do kwadratu, co sprawia, że duże odchylenia są karane surowiej niż małe.

RMSE można obliczyć według poniższego wzoru, gdzie \(i\)-ty squared_diff to kwadrat \(i\)-tego błędu.

$$RMSE = \sqrt{\frac{1}{n} \cdot \sum_{i=1} ^n i\text{th squared_diff}}$$

W tym ćwiczeniu obliczysz RMSE swoich predykcji.

W przestrzeni roboczej dostępny jest wynik poprzedniego ćwiczenia – test_enriched, czyli dane testowe z nową kolumną .pred zawierającą predykcje modelu poza próbą.

Instrukcje

100 XP
  • Oblicz różnice między predykcjami a ocenami końcowymi dla każdego elementu, podnieś je do kwadratu i zapisz jako squared_diffs.
  • Użyj powyższego wzoru, aby obliczyć RMSE, i zapisz wynik jako rmse_manual.
  • Użyj funkcji rmse(), aby obliczyć błąd, i zapisz wynik jako rmse_auto.
  • Wyświetl rmse_manual i rmse_auto, żeby sprawdzić, czy są równe.