1. Learn
  2. /
  3. Cursuri
  4. /
  5. Reducerea dimensionalității în R

Connected

exercițiu

Caracteristici cu informații mutuale

Cadrul de date credit_df conține mai multe caracteristici continue. Atunci când două caracteristici continue sunt corelate, ele conțin aceleași informații — un concept numit informație mutuală. Caracteristicile puternic corelate nu sunt doar redundante: ele pot cauza probleme în modelare. De exemplu, în regresie, caracteristicile puternic corelate (adică multicoliniaritatea) pot produce rezultate fără sens. Pentru a înțelege mai bine informația mutuală, vei crea un grafic de corelație care să identifice caracteristicile cu informații mutuale.

Pachetele tidyverse și corrr au fost deja încărcate pentru tine.

Instrucțiuni

100 XP
  • Folosește correlate() și rplot() pentru a crea un grafic de corelație al caracteristicilor numerice din credit_df.