Inconsistente categorieën
In deze oefening ga je terug naar de airlines DataFrame uit de vorige les.
Als herinnering: de DataFrame bevat vluchtmetadata zoals de luchtvaartmaatschappij, de bestemming, wachttijden en antwoorden op kernvragen over netheid, veiligheid en tevredenheid op San Francisco Airport.
In deze oefening bekijk je twee categorische kolommen uit deze DataFrame, namelijk dest_region en dest_size. Je beoordeelt hoe je ze het beste kunt aanpakken en zorgt dat ze opgeschoond en klaar zijn voor analyse. Het pakket pandas is geïmporteerd als pd, en de DataFrame airlines staat in je omgeving.
Deze oefening maakt deel uit van de cursus
Data opschonen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print unique values of both columns
print(airlines['dest_region'].____())
print(airlines['____'].____())