1. Apprendre
  2. /
  3. Cours
  4. /
  5. Manipulation de données avec pandas

Connected

Exercice

Remplacer les valeurs manquantes

Une autre façon de traiter les valeurs manquantes consiste à les remplacer toutes par la même valeur. Pour les variables numériques, une option est de remplacer par 0 — c'est ce que vous ferez ici. Toutefois, lorsque vous remplacez des valeurs manquantes, vous posez des hypothèses sur leur signification. Dans ce cas-ci, vous supposerez qu'un nombre manquant d'unités vendues signifie qu'aucune vente de ce type d'avocat n'a été réalisée cette semaine-là.

Dans cet exercice, vous verrez comment le remplacement des valeurs manquantes peut affecter la distribution d'une variable à l'aide d'histogrammes. Vous pouvez tracer des histogrammes pour plusieurs variables à la fois comme suit :

dogs[["height_cm", "weight_kg"]].hist()

pandas a été importé sous le nom pd et matplotlib.pyplot sous le nom plt. Le jeu de données avocados_2016 est disponible.

Instructions 1/2

undefined XP
    1
    2
  • Une liste a été créée, cols_with_missing, contenant les noms des colonnes avec des valeurs manquantes : "small_sold", "large_sold" et "xl_sold".
  • Créez un histogramme de ces colonnes.
  • Affichez le graphique.