Des récapitulatifs efficaces
Bien que pandas et NumPy disposent de nombreuses fonctions, vous pouvez parfois avoir besoin d'une fonction différente pour récapituler vos données.
La méthode .agg()
vous permet d'appliquer vos propres fonctions personnalisées à un DataFrame, ou d’appliquer des fonctions à plusieurs colonnes d'un DataFrame à la fois, ce qui rend vos agrégations extrêmement efficaces. Par exemple,
df['column'].agg(function)
Dans la fonction personnalisée de cet exercice, "IQR" est l'abréviation de l'intervalle interquartile, qui correspond au 75e percentile moins le 25e percentile. Il s'agit d'une alternative à l'écart-type, utile si vos données contiennent des valeurs aberrantes.
sales
est disponible et pandas
est chargé en tant que pd
.
Cet exercice fait partie du cours
Manipulation de données avec pandas
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# A custom IQR function
def iqr(column):
return column.quantile(0.75) - column.quantile(0.25)
# Print IQR of the temperature_c column
print(____)