1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Modeling with tidymodels in R

Connected

Cvičení

Odstranění korelovaných prediktorů pomocí recipes

Odstranění vzájemně korelovaných prediktorových proměnných z trénovací a testovací sady je důležitým krokem feature engineeringu – zajistíš tím, že trénování modelu proběhne co nejplynuleji.

Jelikož jsi zjistil/a, že monthly_charges a avg_data_gb jsou silně korelovány, je potřeba přidat do pipeline feature engineeringu pro telekomunikační data korelační filtr pomocí step_corr().

V tomto cvičení vytvoříš objekt recipe, který z telekomunikačních dat odstraní korelované prediktory.

Datasety telecom_training a telecom_test jsou již načteny do tvého prostředí.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Vytvoř objekt recipe s názvem telecom_cor_rec, který nastaví canceled_service jako výstupní proměnnou a všechny ostatní sloupce z telecom_training jako prediktorové proměnné.
  • Přidej krok předzpracování, který odstraní silně korelované prediktorové proměnné – použij selektor all_numeric() a práh korelace 0,8.