1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning s balíčkem caret v R

Connected

cvičení

10násobná křížová validace

Jak jsi viděl/a ve videu, lepším přístupem k validaci modelů je použití více systematických testovacích sad místo jediného náhodného rozdělení na trénovací a testovací část. Balíček caret to naštěstí velmi usnadňuje:

model <- train(y ~ ., my_data)

caret podporuje mnoho typů křížové validace. Typ křížové validace a počet foldů můžeš nastavit pomocí funkce trainControl(), kterou předáš argumentu trControl ve funkci train():

model <- train(
  y ~ ., 
  my_data,
  method = "lm",
  trControl = trainControl(
    method = "cv", 
    number = 10,
    verboseIter = TRUE
  )
)

Důležité je, že metodu modelování předáváš hlavní funkci train(), zatímco metodu křížové validace předáváš funkci trainControl().

Pokyny

100 XP
  • Natrénuj lineární regresi, která modeluje proměnnou price s využitím všech ostatních proměnných v datasetu diamonds jako prediktorů. Použij funkci train() a 10násobnou křížovou validaci. (Poznámka: pracujeme s podmnožinou plného datasetu diamonds, aby operace proběhla rychleji – dataset se ale stále jmenuje diamonds.)
  • Vypiš model do konzole a prohlédni si výsledky.