1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Modeling with tidymodels in R

Connected

Cvičení

Proces feature engineeringu

Aby bylo možné feature engineering začlenit do modelovacího procesu, je nutné trénovací a testovací datové sady předzpracovat ještě před fází trénování modelu. S dovednostmi, které sis osvojil/a v této kapitole, dokážeš využít všechny dostupné prediktory v telekomunikačních datech k trénování logistického regresního modelu.

V tomto cvičení vytvoříš pipeline pro feature engineering na telekomunikačních datech a použiješ ji k transformaci trénovací a testovací datové sady.

Do tvého prostředí byly načteny datové sady telecom_training a telecom_test a specifikace logistického regresního modelu logistic_model.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Vytvoř objekt recipe s názvem telecom_recipe, který nastaví výstupní proměnnou na canceled_service a všechny ostatní sloupce z telecom_training jako prediktory.
  • Pomocí selector funkcí odstraň korelované prediktory s prahem 0,8, logaritmicky transformuj všechny numerické prediktory, normalizuj všechny numerické prediktory a vytvoř dummy proměnné pro všechny nominální prediktory.