1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning s balíčkem caret v R

Connected

cvičení

Vytvoř vlastní indexy pro trénink a test

Jak jsi viděl/a ve videu, v této kapitole se zaměříme na reálný dataset, který propojuje všechny koncepty probírané v předchozích kapitolách.

Dataset churn obsahuje data o různých zákaznících telekomunikační společnosti. Úkolem je předpovědět, kteří zákazníci zruší svůj tarif (tzv. churn).

V této kapitole prozkoumáš dva různé typy prediktivních modelů: glmnet a rf. Nejprve proto vytvoříme znovupoužitelný objekt trainControl, který ti umožní spolehlivě oba modely porovnat.

Pokyny

100 XP

V tvém pracovním prostředí jsou načteny objekty churn_x a churn_y.

  • Pomocí createFolds() vytvoř 5 CV foldů pro churn_y, což je cílová proměnná pro toto cvičení.
  • Předej je funkci trainControl() a vytvoř tak znovupoužitelný trainControl pro porovnávání modelů.