1. Nauka
  2. /
  3. Kursy
  4. /
  5. Redukcja wymiarowości w R

Connected

ćwiczenie

Identyfikowanie silnie skorelowanych cech

Korzystając z danych w house_sales_df, przećwiczysz identyfikowanie cech o wysokiej korelacji. Wysoka korelacja między cechami wskazuje na redundantne informacje i może powodować problemy w modelowaniu – na przykład wielowspółliniowość w modelach regresji. Określisz, które z silnie skorelowanych cech warto usunąć. Macierz korelacji pomoże ci wskazać te cechy.

Pakiety tidyverse i corrr zostały już wczytane.

Instrukcje

100 XP
  • Utwórz wykres korelacji z wartościami korelacji wyświetlonymi na wykresie.