De verklarende variabelen verkennen
Als de responsvariabele logisch is, liggen alle punten op de lijnen \(y=0\) en \(y=1\), waardoor het lastig is om te zien wat er gebeurt. In de video was het, totdat je de trendlijn zag, niet duidelijk hoe de verklarende variabele op elke lijn verdeeld was. Dit kun je oplossen met een histogram van de verklarende variabele, gegroepeerd naar de respons.
Je gebruikt deze histogrammen om de churn-gegevensset van financiële diensten uit de video te leren kennen.
churn is beschikbaar als een pandas DataFrame.
Deze oefening maakt deel uit van de cursus
Introductie tot regressie met statsmodels in Python
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
# Create the histograms of time_since_last_purchase split by has_churned
sns.____(____)
plt.show()