LoslegenKostenlos loslegen

Diskretisierung einer bestimmten Variable

Um Predictor-Insight-Grafiken für kontinuierliche Variablen zu erstellen, musst du sie zuerst diskretisieren. In Python kannst du Spalten in pandas mit der Methode qcut diskretisieren.

Um zu prüfen, ob die Variable sinnvoll diskretisiert wurde, kannst du mit der Methode groupby verifizieren, dass die Bins ungefähr gleich groß sind:

print(basetable.groupby("discretized_variable").size()

Diese Übung ist Teil des Kurses

Einführung in Predictive Analytics mit Python

Kurs anzeigen

Anleitung zur Übung

  • Verwende die Methode qcut, um die Variable time_since_last_donation in 10 Gruppen zu diskretisieren. Weisen diese Variable einer neuen Spalte namens "bins_recency" zu.
  • Verwende die Methode groupby, um zu überprüfen, dass die Bins ungefähr gleich groß sind.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Discretize the variable time_since_last_donation in 10 bins
basetable["bins_recency"] = pd.qcut(____,____)

# Print the group sizes of the discretized variable
print(basetable.groupby("____").size())
Code bearbeiten und ausführen