Tidy data
Je gegevens herstructureren heeft verschillende toepassingen. Een belangrijke toepassing is overschakelen van een indeling die geschikt is voor data-analyse naar een indeling die geschikt is voor rapportage. Dit concept wordt verder uitgewerkt in de Tidy data-paper van Hadley Wickham.
Data in een tidy-indeling maakt ook groupby-bewerkingen mogelijk, zoals je in de vorige oefening hebt gezien.
In deze oefening gebruik je melt() en .pivot_table() uit pandas om je gegevens van de ene vorm naar de andere om te zetten. Onthoud dat je na het aanroepen van .pivot_table() op je data ook de methode .reset_index() moet aanroepen om je oorspronkelijke DataFrame terug te krijgen.
Voordat je begint met het herstructureren van de airquality-DataFrame, bekijk deze eerst in de shell. We hebben pandas geïmporteerd als pd.
Deze oefening maakt deel uit van de cursus
Python voor R-gebruikers
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Melt the airquality DataFrame
airquality_melted = ____(____, id_vars=['Day', 'Month'])
print(airquality_melted)