1. Apprendre
  2. /
  3. Cours
  4. /
  5. Manipulation de données avec pandas

Connected

Exercice

Résumés efficaces

Même si pandas et NumPy offrent une foule de fonctions, il arrive que vous ayez besoin d'une fonction différente pour résumer vos données.

La méthode .agg() vous permet d'appliquer vos propres fonctions personnalisées à un DataFrame et d'appliquer des fonctions à plusieurs colonnes d'un DataFrame en une seule fois, rendant vos agrégations très efficaces. Par exemple,

df['column'].agg(function)

Dans la fonction personnalisée pour cet exercice, "IQR" est l'abréviation de « écart interquartile », soit le 75e centile moins le 25e centile. C'est une alternative à l'écart type, utile si vos données contiennent des valeurs aberrantes.

sales est disponible et pandas est chargé sous pd.

Instructions 1/3

undefined XP
  • 1
    • Utilisez la fonction personnalisée iqr définie pour vous avec .agg() afin d'afficher l'IQR de la colonne temperature_c de sales.
  • 2
    • Modifiez la sélection de colonnes pour utiliser la fonction personnalisée iqr avec .agg() et afficher l'IQR de temperature_c, fuel_price_usd_per_l et unemployment, dans cet ordre.
  • 3
    • Mettez à jour les fonctions d'agrégation appelées par .agg() : incluez iqr et "median" dans cet ordre.