Konsistenz finden
In dieser Übung und im gesamten Kapitel arbeitest du mit dem DataFrame airlines
, der die Umfrageergebnisse von Fluggästen am Flughafen San Francisco enthält.
Der DataFrame enthält Flugmetadaten wie die Fluggesellschaft, den Zielort, Wartezeiten sowie Antworten auf wichtige Fragen zu Sauberkeit, Sicherheit und Zufriedenheit. Ein weiterer DataFrame mit dem Namen categories
wurde erstellt, der alle korrekten möglichen Werte für die Umfragespalten enthält.
In dieser Übung verwendest du diese beiden DataFrames, um Umfrageantworten mit inkonsistenten Werten zu finden und sie zu löschen, indem du einen äußeren und inneren Join dieser beiden DataFrames durchführst, wie in der Videoübung gezeigt. Das Paket pandas
wurde als pd
importiert, und die DataFrames airlines
und categories
befinden sich in deiner Umgebung.
Diese Übung ist Teil des Kurses
Datenbereinigung in Python
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Print categories DataFrame
print(____)
# Print unique values of survey columns in airlines
print('Cleanliness: ', airlines['cleanliness'].____, "\n")
print('Safety: ', ____, "\n")
print('Satisfaction: ', ____, "\n")