1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Redukce dimenzionality v R

Connected

Cvičení

Vytvoř recept pro silně korelované proměnné

Jakmile identifikuješ silně korelované proměnné, nemusíš je odstraňovat ručně – místo toho využij krok step_corr() v balíčku tidymodels. step_corr() neodstraní všechny proměnné, které spolu korelují. Snaží se odebrat co nejmenší počet proměnných. Principiálně – jak jsi viděl/a v úloze s výběrem odpovědi – odstraní tu proměnnou, která se nejvíce překrývá s kombinací ostatních proměnných. Logika je taková, že ostatní proměnné nesou stejnou informaci, takže překrývající se informace odstraněné proměnné je v nich stále obsažena.

Balíčky tidyverse a tidymodels jsou už načtené.

Pokyny

100 XP
  • Vytvoř recept, který používá step_corr() s prahem 0,7 a aplikuje tento krok pouze na numerické prediktory.
  • Aplikuj recept na house_sales_df a výsledná filtrovaná data ulož do filtered_house_sales_df.
  • Pomocí tidy() zjisti, který sloupec nebo sloupce filtr step_corr() odstranil.