Rester descriptif
Afin de mieux comprendre l'expérience des voyageurs à l'aéroport de San Francisco, le service d'assurance qualité a envoyé un questionnaire qualitatif à tous les voyageurs ayant attribué à l'aéroport la note la plus basse dans toutes les catégories possibles. L'objectif de ce questionnaire est d'identifier les tendances communes dans les commentaires des voyageurs concernant l'aéroport.
Leur réponse est enregistrée dans la colonne « survey_response
». En y regardant de plus près, vous avez constaté que certaines réponses étaient les plus courtes possibles, sans grande substance. Dans cet exercice, vous isolerez les réponses dont le nombre de caractères est supérieur à 40 et vous assurerez que votre nouveau DataFrame contient les réponses de 40 caractères ou plus à l'aide d'une instruction « assert
».
Le DataFrame airlines
se trouve dans votre environnement, et pandas
est importé sous le nom pd
.
Cet exercice fait partie du cours
Nettoyage des données en Python
Instructions
- À l'aide du DataFrame
airlines
, enregistrez la longueur de chaque instance dans la colonnesurvey_response
deresp_length
en utilisant.str.len()
. - Veuillez isoler les lignes d'
airlines
s dont l'resp_length
est supérieure à40
. - Veuillez noter que la longueur minimale de l'
survey_response
dansairlines_survey
est désormais supérieure à celle de40
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Store length of each row in survey_response column
resp_length = ____
# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]
# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____
# Print new survey_response column
print(airlines_survey['survey_response'])