LoslegenKostenlos loslegen

Korrelierte Prädiktoren entdecken

Korrelierte Prädiktorvariablen liefern redundante Informationen und können den Modellanpassungsprozess negativ beeinflussen. Wenn zwei Variablen stark korreliert sind, verändern sich ihre Werte linear zueinander und liefern deiner Machine-Learning-Algorithmen daher dieselben Informationen. Dieses Phänomen wird als Multikollinearität bezeichnet.

Bevor du mit der Modellanpassung beginnst, ist es wichtig, deinen Datensatz zu untersuchen, diese Zusammenhänge aufzudecken und sie in deinen Feature-Engineering-Schritten zu entfernen.

In dieser Übung untersuchst du den Datensatz telecom_training, indem du eine Korrelationsmatrix aller numerischen Prädiktorvariablen erstellst.

Die Daten telecom_training wurden in deiner Sitzung geladen.

Diese Übung ist Teil des Kurses

Modellierung mit tidymodels in R

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

telecom_training %>% 
  # Select numeric columns
  ___(___) %>% 
  # Calculate correlation matrix
  ___
Code bearbeiten und ausführen