Aan de slagGa gratis aan de slag

Hou het beschrijvend

Om de ervaringen van reizigers op San Francisco Airport beter te begrijpen, heeft de kwaliteitsafdeling een kwalitatieve vragenlijst gestuurd naar alle reizigers die de luchthaven de laagste score in alle categorieën gaven. Het doel van deze vragenlijst is om terugkerende patronen te vinden in wat reizigers over de luchthaven zeggen.

Hun antwoord staat in de kolom survey_response. Bij nader inzien merkte je dat een paar antwoorden de kortst mogelijke hoeveelheid tekens bevatten en weinig inhoud hebben. In deze oefening isoleer je de antwoorden met een tekenaantal hoger dan 40 en zorg je ervoor dat je nieuwe DataFrame alleen reacties bevat met 40 tekens of meer met behulp van een assert-instructie.

De DataFrame airlines staat in je omgeving en pandas is geïmporteerd als pd.

Deze oefening maakt deel uit van de cursus

Data opschonen in Python

Cursus bekijken

Oefeninstructies

  • Gebruik de DataFrame airlines en sla de lengte van elke waarde in de kolom survey_response op in resp_length met .str.len().
  • Isoleer de rijen van airlines waarvoor resp_length groter is dan 40.
  • Controleer met assert dat de kleinste survey_response-lengte in airlines_survey nu groter is dan 40.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Store length of each row in survey_response column
resp_length = ____

# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]

# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____

# Print new survey_response column
print(airlines_survey['survey_response'])
Code bewerken en uitvoeren