`.melt()` gebruiken om overheidsdata te herstructureren
Het US Bureau of Labor Statistics (BLS) levert vaak reeksen in een makkelijk leesbaar formaat: een aparte kolom voor elke maand en elk jaar op een eigen rij. Dit brede formaat maakt het echter lastig om de gegevens in de tijd te plotten. In deze oefening ga je een tabel met Amerikaanse werkloosheidspercentages van de BLS omvormen naar een formaat dat je kunt plotten met .melt(). Je moet een datumkolom toevoegen en daarop sorteren om correct te kunnen plotten.
De data over het werkloosheidspercentage is voor je ingeladen in een tabel ur_wide. Verken deze tabel gerust voordat je aan de oefening begint.
Deze oefening maakt deel uit van de cursus
Data samenvoegen met pandas
Oefeninstructies
- Gebruik
.melt()om alle kolommen vanur_widete unpivotten, behalveyear, en zorg dat de kolommen met de maanden en de waarden respectievelijkmonthenunempl_rateheten. Sla het resultaat op alsur_tall. - Voeg aan
ur_talleen kolomdatetoe die de kolommenyearenmonthcombineert tot één langere string in het formaat jaar-maand en zet die om naar een datumtype. - Sorteer
ur_tallopdateen sla dit op alsur_sorted. - Plot met
ur_sortedunempl_rateop de y-as endateop de x-as.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# unpivot everything besides the year column
ur_tall = ____
# Create a date column using the month and year columns of ur_tall
ur_tall['date'] = pd.to_datetime(ur_tall['____'] + '-' + ____)
# Sort ur_tall by date in ascending order
ur_sorted = ____
# Plot the unempl_rate by date
ur_sorted.plot(____)
plt.show()