Korrelierte Prädiktoren entdecken
Korrelierte Prädiktorvariablen liefern redundante Informationen und können den Modellanpassungsprozess negativ beeinflussen. Wenn zwei Variablen stark korreliert sind, verändern sich ihre Werte linear zueinander und liefern deiner Machine-Learning-Algorithmen daher dieselben Informationen. Dieses Phänomen wird als Multikollinearität bezeichnet.
Bevor du mit der Modellanpassung beginnst, ist es wichtig, deinen Datensatz zu untersuchen, diese Zusammenhänge aufzudecken und sie in deinen Feature-Engineering-Schritten zu entfernen.
In dieser Übung untersuchst du den Datensatz telecom_training, indem du eine Korrelationsmatrix aller numerischen Prädiktorvariablen erstellst.
Die Daten telecom_training wurden in deiner Sitzung geladen.
Diese Übung ist Teil des Kurses
Modellierung mit tidymodels in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
telecom_training %>%
# Select numeric columns
___(___) %>%
# Calculate correlation matrix
___