1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Modelare cu tidymodels în R

Connected

Bài tập

Eliminarea predictorilor corelați cu recipes

Eliminarea variabilelor predictoare puternic corelate din seturile de antrenament și de testare este un pas important de inginerie a caracteristicilor, care asigură o ajustare mai lină a modelului.

Acum că ai descoperit că monthly_charges și avg_data_gb sunt puternic corelate, trebuie să adaugi un filtru de corelație cu step_corr() în pipeline-ul de inginerie a caracteristicilor pentru datele de telecomunicații.

În acest exercițiu, vei crea un obiect recipe care elimină predictorii corelați din datele de telecomunicații.

Seturile de date telecom_training și telecom_test au fost încărcate în sesiunea ta.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Creează un obiect recipe, telecom_cor_rec, care setează variabila de rezultat la canceled_service și toate coloanele rămase din telecom_training ca variabile predictoare.
  • Adaugă un pas de preprocesare care elimină variabilele predictoare puternic corelate, folosind funcția selector all_numeric() și un prag de corelație de 0,8.