1. Learn
  2. /
  3. Cursuri
  4. /
  5. Modelare cu tidymodels în R

Connected

exercițiu

Procesul de inginerie a caracteristicilor

Pentru a integra ingineria caracteristicilor în procesul de modelare, seturile de date de antrenament și de testare trebuie preprocesate înainte de etapa de antrenare a modelului. Cu noile cunoștințe dobândite în acest capitol, vei putea folosi toate variabilele predictor disponibile din datele de telecomunicații pentru a antrena modelul tău de regresie logistică.

În acest exercițiu, vei crea un pipeline de inginerie a caracteristicilor pe datele de telecomunicații și îl vei folosi pentru a transforma seturile de date de antrenament și de testare.

Seturile de date telecom_training și telecom_test, precum și specificația modelului tău de regresie logistică, logistic_model, au fost încărcate în sesiunea ta.

Instrucțiuni 1/3

undefined XP
    1
    2
    3
  • Creează un obiect recipe, denumit telecom_recipe, care setează variabila rezultat la canceled_service și toate coloanele rămase din telecom_training ca variabile predictor.
  • Folosind funcții de selecție, elimină predictorii corelați la un prag de 0,8, aplică transformarea logaritmică tuturor predictorilor numerici, normalizează toți predictorii numerici și creează variabile dummy pentru toate variabilele predictor nominale.