Rester dans la description
Afin de mieux comprendre l'expérience des voyageurs à l'aéroport de San Francisco, le service d'assurance qualité a envoyé un questionnaire de satisfaction à tous les voyageurs ayant attribué à l'aéroport la note la plus basse dans toutes les catégories possibles. L'objectif de ce questionnaire est d'identifier les tendances communes dans les commentaires des voyageurs concernant l'aéroport.
Leur réponse est enregistrée dans la colonne survey_response. En y regardant de plus près, vous avez constaté que certaines réponses étaient les plus courtes possibles, sans grande substance. Dans cet exercice, vous isolerez les réponses dont le nombre de caractères est supérieur à 40 et vous assurerez que votre nouveau DataFrame contient les réponses de 40 caractères ou plus à l'aide d'une instruction assert.
Le DataFrame airlines se trouve dans votre environnement, et pandas est importé sous le nom pd.
Cet exercice fait partie du cours
Nettoyage des données en Python
Instructions
- À l'aide du DataFrame
airlines, enregistrez la longueur de chaque instance dans la colonnesurvey_responsederesp_lengthen utilisant.str.len(). - Isolez les lignes de
airlinesdontresp_lengthest supérieur à40. - Notez que la longueur minimale de
survey_responsedansairlines_surveyest désormais supérieure à40.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Store length of each row in survey_response column
resp_length = ____
# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]
# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____
# Print new survey_response column
print(airlines_survey['survey_response'])