Statistiques descriptives pour les deux classes
Considérez le code .groupby() suivant :
# Regrouper par x et calculer l'écart-type
df.groupby(['x']).std()
Ici, un DataFrame df est regroupé par la colonne 'x', puis l’écart-type est calculé pour toutes les colonnes de df pour chaque valeur de 'x'. La méthode .groupby() est extrêmement utile lorsque vous souhaitez examiner des colonnes spécifiques de votre jeu de données. Vous allez ici explorer davantage la colonne 'Churn' pour voir s’il existe des différences entre clients partis et restés. Une version sous-ensemble du DataFrame telco, composée des colonnes 'Churn', 'CustServ_Calls' et 'Vmail_Message', est disponible dans votre espace de travail.
Si vous avez besoin de réviser le fonctionnement de .groupby(), veuillez vous référer au cours prérequis Manipulating DataFrames with pandas.
Cet exercice fait partie du cours
Marketing Analytics : prédire l’attrition client en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Group telco by 'Churn' and compute the mean
print(telco.____(['____']).____())