1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning s balíčkem caret v R

Connected

cvičení

Trénování glmnet s vlastním trainControl

Teď, když máš vlastní objekt trainControl, natrénuj model glmnet na datasetu „don't overfit". Připomeň si z videa, že glmnet je rozšíření zobecněného lineárního regresního modelu (neboli glm), které omezuje velikost koeficientů, aby zabránilo přetrénování. Tato technika se běžně označuje jako „penalizovaná" regrese a je velmi užitečná u datasetů s mnoha prediktory a malým počtem hodnot.

glmnet umožňuje trénovat dva různé druhy penalizovaných modelů, které se ovládají parametrem alpha:

  • Ridge regrese (neboli alpha = 0)
  • Lasso regrese (neboli alpha = 1)

Nyní natrénuješ model glmnet na datasetu „don't overfit" s výchozím nastavením balíčku caret.

Pokyny

100 XP
  • Natrénuj model glmnet s názvem model na datech overfit. Použij vlastní trainControl z předchozího cvičení (myControl). Proměnná y je cílová proměnná a všechny ostatní proměnné jsou vysvětlující.
  • Vypiš model do konzole.
  • Pomocí funkce max() najdi maximální hodnotu statistiky ROC uloženou někde v model[["results"]].