Statistiques descriptives pour les deux classes
Considérez le code .groupby() suivant :
# Regrouper par x et calculer l'écart-type
df.groupby(['x']).std()
Ici, un DataFrame df est regroupé par la colonne 'x', puis l’écart-type est calculé pour toutes les colonnes de df pour chaque valeur de 'x'. La méthode .groupby() est extrêmement utile lorsque vous souhaitez examiner des colonnes spécifiques de votre jeu de données. Vous allez ici explorer davantage la colonne 'Churn' pour voir s’il existe des différences entre clients partis et restés. Une version sous-ensemble du DataFrame telco, composée des colonnes 'Churn', 'CustServ_Calls' et 'Vmail_Message', est disponible dans votre espace de travail.
Si vous avez besoin de réviser le fonctionnement de .groupby(), veuillez vous référer au cours prérequis Manipulating DataFrames with pandas.
Cet exercice fait partie du cours
<cours>Marketing Analytics : prédire l’attrition client en Python</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Group telco by 'Churn' and compute the mean
print(telco.____(['____']).____())