Stark korrelierte Features erkennen
Mit den Daten in house_sales_df übst du, Features mit hoher Korrelation zu erkennen. Eine hohe Korrelation zwischen Features deutet auf redundante Informationen hin und kann beim Modellieren zu Problemen führen, zum Beispiel zu Multikollinearität in Regressionsmodellen. Du entscheidest, welche der stark korrelierten Features entfernt werden sollen. Eine Korrelationsmatrix hilft dir dabei, stark korrelierte Features zu identifizieren.
Die Pakete tidyverse und corrr wurden für dich geladen.
Diese Übung ist Teil des Kurses
Dimensionsreduktion in R
Anleitung zur Übung
- Erstelle eine Korrelationsgrafik, in der die Korrelationswerte direkt auf der Grafik angezeigt werden.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a correlation plot of the house sales
house_sales_df %>%
___() %>%
___() %>%
___(print_cor = ___) +
theme(axis.text.x = element_text(angle = 90, hjust = 1))