LoslegenKostenlos loslegen

Beschreibend bleiben

Um die Erfahrungen der Reisenden am Flughafen von San Francisco besser zu verstehen, hat die Qualitätssicherungsabteilung einen qualitativen Fragebogen an alle Reisenden verschickt, die dem Flughafen in allen möglichen Kategorien die schlechteste Note gegeben haben. Das Ziel dieses Fragebogens ist es, gemeinsame Muster in den Aussagen der Reisenden über den Flughafen zu erkennen.

Ihre Antwort wird in der Spalte survey_response gespeichert. Bei genauerem Hinsehen fiel dir auf, dass einige der Antworten die kürzestmögliche Zeichenanzahl ohne viel Inhalt hatten. In dieser Übung isolierst du die Antworten mit einer Zeichenzahl von mehr als 40 und stellst sicher, dass dein neuer DataFrame nur Antworten mit 40 Zeichen oder mehr enthält, indem du eine assert-Anweisung verwendest.

Der DataFrame airlines befindet sich in deiner Umgebung, und pandas wird als pd importiert.

Diese Übung ist Teil des Kurses

Datenbereinigung in Python

Kurs anzeigen

Anleitung zur Übung

  • Speichere mithilfe des airlines-DataFrame die Länge jeder Instanz in der Spalte survey_response in resp_length, indem du .str.len() verwendest.
  • Isoliere die Zeilen von airlines, bei denen resp_length größer ist als 40.
  • Bestätige, dass die kleinste Länge von survey_response in airlines_survey jetzt größer ist als 40.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Store length of each row in survey_response column
resp_length = ____

# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]

# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____

# Print new survey_response column
print(airlines_survey['survey_response'])
Code bearbeiten und ausführen