Esplorare le variabili esplicative
Quando la variabile risposta è logica, tutti i punti si trovano sulle linee \(y=0\) e \(y=1\), il che rende difficile capire cosa sta succedendo. Nel video, finché non hai visto la linea di tendenza, non era chiaro come la variabile esplicativa fosse distribuita su ciascuna linea. Questo si può risolvere con un istogramma della variabile esplicativa, raggruppato per la risposta.
Userai questi istogrammi per familiarizzare con l'insieme di dati sul churn nei servizi finanziari visto nel video.
churn è disponibile come DataFrame di pandas.
Questo esercizio fa parte del corso
Introduzione alla regressione con statsmodels in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create the histograms of time_since_last_purchase split by has_churned
sns.____(____)
plt.show()