1. Learn
  2. /
  3. Cursuri
  4. /
  5. Modelare cu tidymodels în R

Connected

exercițiu

Descoperirea predictorilor corelați

Variabilele predictoare corelate furnizează informații redundante și pot afecta negativ procesul de ajustare a modelului. Când două variabile sunt puternic corelate, valorile lor se modifică liniar una față de cealaltă, oferind astfel aceleași informații algoritmilor de machine learning. Acest fenomen este cunoscut sub numele de multicolinearitate.

Înainte de a începe procesul de ajustare a modelului, este important să explorezi setul de date pentru a descoperi aceste relații și a le elimina în pașii de inginerie a caracteristicilor.

În acest exercițiu, vei explora setul de date telecom_training creând o matrice de corelație pentru toate variabilele predictoare numerice.

Datele telecom_training au fost încărcate în sesiunea ta.

Instrucțiuni 1/3

undefined XP
    1
    2
    3
  • Selectează toate coloanele numerice din datele telecom_training.
  • Creează o matrice de corelație a coloanelor numerice din telecom_training.