LoslegenKostenlos loslegen

Stark korrelierte Features erkennen

Mit den Daten in house_sales_df übst du, Features mit hoher Korrelation zu erkennen. Eine hohe Korrelation zwischen Features deutet auf redundante Informationen hin und kann beim Modellieren zu Problemen führen, zum Beispiel zu Multikollinearität in Regressionsmodellen. Du entscheidest, welche der stark korrelierten Features entfernt werden sollen. Eine Korrelationsmatrix hilft dir dabei, stark korrelierte Features zu identifizieren.

Die Pakete tidyverse und corrr wurden für dich geladen.

Diese Übung ist Teil des Kurses

Dimensionsreduktion in R

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Korrelationsgrafik, in der die Korrelationswerte direkt auf der Grafik angezeigt werden.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a correlation plot of the house sales
house_sales_df %>% 
  ___() %>% 
  ___() %>% 
  ___(print_cor = ___) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1))
Code bearbeiten und ausführen