1. products.learn
  2. /
  3. Course
  4. /
  5. Nettoyage des données en Python

Connected

exercise

Rester descriptif

Pour mieux comprendre l’expérience des voyageurs à l’aéroport de San Francisco, l’équipe d’assurance qualité a envoyé un questionnaire qualitatif à toutes les personnes qui ont attribué la pire note à l’aéroport dans toutes les catégories. L’objectif est d’identifier les tendances récurrentes dans les commentaires des voyageurs sur l’aéroport.

Leurs réponses se trouvent dans la colonne survey_response. En y regardant de plus près, vous constatez que certaines réponses utilisent le minimum de caractères possible et n’apportent pas grand-chose. Dans cet exercice, vous allez isoler les réponses dont le nombre de caractères est supérieur à 40, puis vérifier que votre nouveau DataFrame ne contient que des réponses de 40 caractères ou plus à l’aide d’une instruction assert.

Le DataFrame airlines est déjà dans votre environnement, et pandas est importé sous le nom pd.

NormalInstructionHeader.heading

100 XP
  • À partir du DataFrame airlines, stockez la longueur de chaque valeur de la colonne survey_response dans resp_length en utilisant .str.len().
  • Isolez les lignes de airlines dont resp_length est supérieur à 40.
  • Vérifiez, avec assert, que la plus petite longueur de survey_response dans airlines_survey est maintenant supérieure à 40.