1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Redukce dimenzionality v R

Connected

Cvičení

Identifikace vysoce korelovaných příznaků

Na datech z house_sales_df si procvičíš identifikaci příznaků s vysokou korelací. Vysoká korelace mezi příznaky signalizuje redundantní informace a může způsobovat problémy při modelování – například multikolinearitu v regresních modelech. Určíš, které z vysoce korelovaných příznaků je vhodné odstranit. Korelační matice ti pomůže tyto příznaky snadno odhalit.

Balíčky tidyverse a corrr jsou už načtené.

Pokyny

100 XP
  • Vytvoř korelační graf s hodnotami korelací přímo vykreslenými v grafu.