Stark korrelierte Features erkennen
Mit den Daten in house_sales_df übst du, Features mit hoher Korrelation zu erkennen. Eine hohe Korrelation zwischen Features deutet auf redundante Informationen hin und kann beim Modellieren zu Problemen führen, zum Beispiel zu Multikollinearität in Regressionsmodellen. Du entscheidest, welche der stark korrelierten Features entfernt werden sollen. Eine Korrelationsmatrix hilft dir dabei, stark korrelierte Features zu identifizieren.
Die Pakete tidyverse und corrr wurden für dich geladen.
Diese Übung ist Teil des Kurses
<Kurs>Dimensionsreduktion in R</Kurs>Übungsanweisungen
- Erstelle eine Korrelationsgrafik, in der die Korrelationswerte direkt auf der Grafik angezeigt werden.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a correlation plot of the house sales
house_sales_df %>%
___() %>%
___() %>%
___(print_cor = ___) +
theme(axis.text.x = element_text(angle = 90, hjust = 1))