1. Learn
  2. /
  3. Courses
  4. /
  5. Reducerea dimensionalității în R

Connected

Exercise

Creează o rețetă pentru corelații ridicate

Odată ce ai identificat caracteristicile puternic corelate, în loc să le elimini manual, poți folosi pasul de rețetă step_corr() din tidymodels. step_corr() nu elimină toate caracteristicile corelate cu altele — încearcă să elimine cât mai puține posibil. Conceptual, așa cum ai văzut în exercițiul cu variante multiple, elimină caracteristica care se suprapune cel mai mult cu orice combinație de alte caracteristici. Ideea este că celelalte caracteristici conțin aceleași informații, astfel încât informația suprapusă a caracteristicii eliminate rămâne reprezentată în celelalte.

Pachetele tidyverse și tidymodels au fost deja încărcate.

Instructions

100 XP
  • Creează o rețetă care folosește step_corr() cu un prag de 0,7, aplicând pasul doar predictorilor numerici.
  • Aplică rețeta pe house_sales_df și stochează datele filtrate în filtered_house_sales_df.
  • Folosește tidy() pentru a identifica coloana sau coloanele eliminate de filtrul step_corr().