Beschreibend bleiben
Um die Erfahrungen der Reisenden am Flughafen von San Francisco besser zu verstehen, hat die Qualitätssicherungsabteilung einen qualitativen Fragebogen an alle Reisenden verschickt, die dem Flughafen in allen möglichen Kategorien die schlechteste Note gegeben haben. Das Ziel dieses Fragebogens ist es, gemeinsame Muster in den Aussagen der Reisenden über den Flughafen zu erkennen.
Ihre Antwort wird in der Spalte survey_response
gespeichert. Bei genauerem Hinsehen fiel dir auf, dass einige der Antworten die kürzestmögliche Zeichenanzahl ohne viel Inhalt hatten. In dieser Übung isolierst du die Antworten mit einer Zeichenzahl von mehr als 40 und stellst sicher, dass dein neuer DataFrame nur Antworten mit 40 Zeichen oder mehr enthält, indem du eine assert
-Anweisung verwendest.
Der DataFrame airlines
befindet sich in deiner Umgebung, und pandas
wird als pd
importiert.
Diese Übung ist Teil des Kurses
Datenbereinigung in Python
Anleitung zur Übung
- Speichere mithilfe des
airlines
-DataFrame die Länge jeder Instanz in der Spaltesurvey_response
inresp_length
, indem du.str.len()
verwendest. - Isoliere die Zeilen von
airlines
, bei denenresp_length
größer ist als40
. - Bestätige, dass die kleinste Länge von
survey_response
inairlines_survey
jetzt größer ist als40
.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Store length of each row in survey_response column
resp_length = ____
# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]
# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____
# Print new survey_response column
print(airlines_survey['survey_response'])