1. Apprendre
  2. /
  3. Cours
  4. /
  5. Introduction à la régression avec statsmodels en Python

Connected

Exercice

Explorer les variables explicatives

Quand la variable réponse est logique, tous les points se trouvent sur les lignes \(y=0\) et \(y=1\), ce qui rend la situation difficile à interpréter. Dans la vidéo, avant d'afficher la ligne de tendance, il n'était pas évident de voir comment la variable explicative se distribuait sur chaque ligne. On peut régler cela à l'aide d'un histogramme de la variable explicative, groupé selon la réponse.

Vous utiliserez ces histogrammes pour vous familiariser avec l'ensemble de données sur l'attrition en services financiers présenté dans la vidéo.

churn est disponible sous forme de DataFrame pandas.

Instructions 1/2

undefined XP
  • 1

    Dans un appel à sns.displot() sur les données churn, tracez time_since_last_purchase sous forme de deux histogrammes, séparés pour chaque valeur de has_churned.

  • 2

    Redessinez les histogrammes en utilisant la colonne time_since_first_purchase, séparés pour chaque valeur de has_churned.