1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning s balíčkem caret v R

Connected

cvičení

In-sample RMSE pro lineární regresi na datasetu diamonds

Jak jsi viděl/a ve videu, součástí kurzu je dataset diamonds — klasický dataset z balíčku ggplot2. Obsahuje fyzické vlastnosti diamantů spolu s cenami, za které se prodaly. Zajímavou modelovací výzvou je předpovídat cenu diamantu na základě jeho vlastností, například pomocí lineární regrese.

Pro trénování lineární regrese používáš funkci lm() v tomto formátu:

mod <- lm(y ~ x, my_data)

Pro získání predikcí pomocí mod na původních datech zavoláš funkci predict():

pred <- predict(mod, my_data)

Pokyny

100 XP
  • Na datasetu diamonds natrénuj lineární model, který predikuje price pomocí všech ostatních proměnných jako prediktorů (tedy price ~ .). Výsledek ulož do model.
  • Pomocí model vytvoř predikce na celém původním datasetu a výsledek ulož do p.
  • Vypočítej chyby podle vzorce \(errors = predicted - actual\) a výsledek ulož do error.
  • Vypočítej RMSE podle vzorce z videa a vypiš ho do konzole.