1. Learn
  2. /
  3. Courses
  4. /
  5. Nettoyage des données en Python

Connected

Exercise

Assurer la cohérence

Dans cet exercice et tout au long de ce chapitre, vous allez travailler avec le DataFrame airlines, qui contient des réponses à un sondage sur l’aéroport de San Francisco provenant de client·e·s de lignes aériennes.

Ce DataFrame comprend des métadonnées de vol comme la compagnie aérienne, la destination, les temps d’attente ainsi que des réponses à des questions clés sur la propreté, la sécurité et la satisfaction. Un autre DataFrame nommé categories a été créé et contient toutes les valeurs possibles correctes pour les colonnes du sondage.

Dans cet exercice, vous utiliserez ces deux DataFrames pour repérer les réponses au sondage qui comportent des valeurs incohérentes et les supprimer, ce qui revient à effectuer respectivement une jointure externe puis interne sur ces deux DataFrames, comme démontré dans la vidéo. Le paquet pandas a été importé sous le nom pd, et les DataFrames airlines et categories sont disponibles dans votre environnement.

Instructions 1/4

undefined XP
    1
    2
    3
    4
  • Affichez le DataFrame categories et examinez de près toutes les catégories valides des colonnes du sondage.
  • Affichez les valeurs uniques des colonnes du sondage dans airlines à l’aide de la méthode .unique().