Exploration des variables explicatives
Lorsque la variable réponse est logique, tous les points se situent sur les lignes \(y=0\) et \(y=1\), ce qui rend difficile la compréhension de la situation. Dans la vidéo, jusqu'à ce que vous voyiez la ligne de tendance, la répartition de la variable explicative sur chaque ligne n'était pas claire. Ce problème peut être résolu à l'aide d'un histogramme de la variable explicative, groupée par la réponse.
Vous utiliserez ces histogrammes pour vous familiariser avec l'ensemble de données sur le désabonnement dans le secteur des services financiers présenté dans la vidéo.
churn
est disponible sous la forme d'un DataFrame pandas
.
Cet exercice fait partie du cours
Introduction à la régression avec statsmodels en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the histograms of time_since_last_purchase split by has_churned
sns.____(____)
plt.show()