1. Learn
  2. /
  3. Courses
  4. /
  5. Uczenie maszynowe z caret w R

Connected

Exercise

RMSE na danych treningowych dla regresji liniowej na zbiorze diamonds

Jak pokazano w filmie, w kursie dostępny jest zbiór danych diamonds – klasyczny zbiór z pakietu ggplot2. Zawiera fizyczne atrybuty diamentów oraz ceny, za jakie zostały sprzedane. Ciekawym wyzwaniem modelarskim jest przewidywanie ceny diamentów na podstawie ich cech, np. za pomocą regresji liniowej.

Przypomnienie: aby dopasować model regresji liniowej, używasz funkcji lm() w następującym formacie:

mod <- lm(y ~ x, my_data)

Aby wykonać predykcje za pomocą mod na oryginalnych danych, wywołujesz funkcję predict():

pred <- predict(mod, my_data)

Instructions

100 XP
  • Dopasuj model regresji liniowej na zbiorze danych diamonds, przewidując price na podstawie wszystkich pozostałych zmiennych (czyli price ~ .). Zapisz wynik do model.
  • Wykonaj predykcje za pomocą model na pełnym oryginalnym zbiorze danych i zapisz wynik do p.
  • Oblicz błędy według wzoru \(errors = predicted - actual\). Zapisz wynik do error.
  • Oblicz RMSE według wzoru poznanego w filmie i wyświetl wynik w konsoli.