1. Learn
  2. /
  3. Cursuri
  4. /
  5. Modelare cu tidymodels în R

Connected

exercițiu

Pipeline complet de inginerie a caracteristicilor

Pachetul recipes este conceput pentru a codifica mai mulți pași de inginerie a caracteristicilor într-un singur obiect, facilitând gestionarea transformărilor de date într-un flux de lucru de machine learning.

În acest exercițiu, vei antrena un pipeline de inginerie a caracteristicilor pentru a pregăti datele despre telecomunicații în vederea modelării.

Tibble-ul telecom_df, precum și seturile de date telecom_training și telecom_test din exercițiile anterioare, au fost încărcate în spațiul tău de lucru.

Instrucțiuni

100 XP
  • Creează o rețetă care prezice canceled_service folosind toți predictorii din datele de antrenament.
  • Elimină predictorii corelați folosind un prag de 0,8.
  • Normalizează toți predictorii numerici.
  • Creează variabile dummy pentru toți predictorii nominali.
  • Antrenează rețeta pe datele de antrenament și aplică-o pe datele de testare.