Erste SchritteKostenlos loslegen

Konsistenz finden

In dieser Übung und im gesamten Kapitel arbeitest du mit dem DataFrame airlines, der die Umfrageergebnisse von Fluggästen am Flughafen San Francisco enthält.

Der DataFrame enthält Flugmetadaten wie die Fluggesellschaft, den Zielort, Wartezeiten sowie Antworten auf wichtige Fragen zu Sauberkeit, Sicherheit und Zufriedenheit. Ein weiterer DataFrame mit dem Namen categories wurde erstellt, der alle korrekten möglichen Werte für die Umfragespalten enthält.

In dieser Übung verwendest du diese beiden DataFrames, um Umfrageantworten mit inkonsistenten Werten zu finden und sie zu löschen, indem du einen äußeren und inneren Join dieser beiden DataFrames durchführst, wie in der Videoübung gezeigt. Das Paket pandas wurde als pd importiert, und die DataFrames airlines und categories befinden sich in deiner Umgebung.

Diese Übung ist Teil des Kurses

Datenbereinigung in Python

Kurs anzeigen

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Print categories DataFrame
print(____)

# Print unique values of survey columns in airlines
print('Cleanliness: ', airlines['cleanliness'].____, "\n")
print('Safety: ', ____, "\n")
print('Satisfaction: ', ____, "\n")
Bearbeiten und Ausführen von Code