Erkundung der erklärenden Variablen
Wenn die Antwortvariable logisch ist, liegen alle Punkte auf den Linien \(y=0\) und \(y=1\), was es schwierig macht zu sehen, was passiert. Im Video war nicht klar, wie die erklärende Variable auf jeder Linie verteilt war, bis du die Trendlinie gesehen hast. Dies kann mit einem Histogramm der erklärenden Variable, gruppiert nach der Antwort, gelöst werden.
Anhand dieser Histogramme lernst du den im Video gezeigten Datensatz zur Abwanderung von Finanzdienstleistern kennen.
churn
ist als pandas
DataFrame verfügbar.
Diese Übung ist Teil des Kurses
Einführung in die Regression mit statsmodels in Python
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create the histograms of time_since_last_purchase split by has_churned
sns.____(____)
plt.show()