Aan de slagGa gratis aan de slag

Consistentie vinden

In deze oefening en de rest van dit hoofdstuk werk je met de DataFrame airlines, die enquêteresultaten over de luchthaven van San Francisco bevat van luchtvaartklanten.

De DataFrame bevat vluchtmetadata zoals de luchtvaartmaatschappij, de bestemming, wachttijden en antwoorden op kernvragen over netheid, veiligheid en tevredenheid. Er is ook een DataFrame categories gemaakt met alle correcte mogelijke waarden voor de enquêtekolommen.

In deze oefening gebruik je beide DataFrames om enquête-antwoorden met inconsistente waarden te vinden en te verwijderen. Je voert daarmee effectief een outer en inner join uit op beide DataFrames, zoals in de video-oefening. Het pakket pandas is geïmporteerd als pd, en de DataFrames airlines en categories staan in je omgeving.

Deze oefening maakt deel uit van de cursus

Data opschonen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print categories DataFrame
print(____)

# Print unique values of survey columns in airlines
print('Cleanliness: ', airlines['cleanliness'].____, "\n")
print('Safety: ', ____, "\n")
print('Satisfaction: ', ____, "\n")
Code bewerken en uitvoeren