CommencerCommencer gratuitement

Des récapitulatifs efficaces

Bien que pandas et NumPy disposent de nombreuses fonctions, vous pouvez parfois avoir besoin d'une fonction différente pour récapituler vos données.

La méthode .agg() vous permet d'appliquer vos propres fonctions personnalisées à un DataFrame, ou d’appliquer des fonctions à plusieurs colonnes d'un DataFrame à la fois, ce qui rend vos agrégations extrêmement efficaces. Par exemple,

df['column'].agg(function)

Dans la fonction personnalisée de cet exercice, "IQR" est l'abréviation de l'intervalle interquartile, qui correspond au 75e percentile moins le 25e percentile. Il s'agit d'une alternative à l'écart-type, utile si vos données contiennent des valeurs aberrantes.

sales est disponible et pandas est chargé en tant que pd.

Cet exercice fait partie du cours

Manipulation de données avec pandas

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# A custom IQR function
def iqr(column):
    return column.quantile(0.75) - column.quantile(0.25)
    
# Print IQR of the temperature_c column
print(____)
Modifier et exécuter le code