1. Öğren
  2. /
  3. Kurs
  4. /
  5. Modeling with tidymodels in R

Connected

Egzersiz

Kompletní pipeline pro feature engineering

Balíček recipes umožňuje zakódovat několik kroků feature engineeringu do jednoho objektu, což usnadňuje správu datových transformací v rámci workflow strojového učení.

V tomto cvičení natrénuješ pipeline feature engineeringu, která připraví telekomunikační data pro modelování.

Do pracovního prostředí jsou načteny tibble telecom_df a také tvoje datasety telecom_training a telecom_test z předchozích cvičení.

Talimatlar

100 XP
  • Vytvoř recept, který predikuje canceled_service pomocí všech prediktivních proměnných v trénovacích datech.
  • Odstraň korelované prediktivní proměnné s prahovací hodnotou 0,8.
  • Normalizuj všechny numerické prediktory.
  • Vytvoř dummy proměnné pro všechny nominální prediktory.
  • Natrénuj recept na trénovacích datech a aplikuj ho na testovací data.