CommencerCommencer gratuitement

Rester descriptif

Afin de mieux comprendre l'expérience des voyageurs à l'aéroport de San Francisco, le service d'assurance qualité a envoyé un questionnaire qualitatif à tous les voyageurs ayant attribué à l'aéroport la note la plus basse dans toutes les catégories possibles. L'objectif de ce questionnaire est d'identifier les tendances communes dans les commentaires des voyageurs concernant l'aéroport.

Leur réponse est enregistrée dans la colonne « survey_response ». En y regardant de plus près, vous avez constaté que certaines réponses étaient les plus courtes possibles, sans grande substance. Dans cet exercice, vous isolerez les réponses dont le nombre de caractères est supérieur à 40 et vous assurerez que votre nouveau DataFrame contient les réponses de 40 caractères ou plus à l'aide d'une instruction « assert ».

Le DataFrame airlines se trouve dans votre environnement, et pandas est importé sous le nom pd.

Cet exercice fait partie du cours

Nettoyage des données en Python

Afficher le cours

Instructions

  • À l'aide du DataFrame airlines, enregistrez la longueur de chaque instance dans la colonne survey_response de resp_length en utilisant .str.len().
  • Veuillez isoler les lignes d'airlines s dont l'resp_length est supérieure à 40.
  • Veuillez noter que la longueur minimale de l'survey_response dans airlines_survey est désormais supérieure à celle de 40.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Store length of each row in survey_response column
resp_length = ____

# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]

# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____

# Print new survey_response column
print(airlines_survey['survey_response'])
Modifier et exécuter le code