`.melt()` gebruiken om overheidsdata te herstructureren

Het US Bureau of Labor Statistics (BLS) levert vaak reeksen in een makkelijk leesbaar formaat: een aparte kolom voor elke maand en elk jaar op een eigen rij. Dit brede formaat maakt het echter lastig om de gegevens in de tijd te plotten. In deze oefening ga je een tabel met Amerikaanse werkloosheidspercentages van de BLS omvormen naar een formaat dat je kunt plotten met .melt(). Je moet een datumkolom toevoegen en daarop sorteren om correct te kunnen plotten.

De data over het werkloosheidspercentage is voor je ingeladen in een tabel ur_wide. Verken deze tabel gerust voordat je aan de oefening begint.

Deze oefening maakt deel uit van de cursus

Data samenvoegen met pandas

Bekijk cursus

Oefeninstructies

Gebruik .melt() om alle kolommen van ur_wide te unpivotten, behalve year, en zorg dat de kolommen met de maanden en de waarden respectievelijk month en unempl_rate heten. Sla het resultaat op als ur_tall.
Voeg aan ur_tall een kolom date toe die de kolommen year en month combineert tot één langere string in het formaat jaar-maand en zet die om naar een datumtype.
Sorteer ur_tall op date en sla dit op als ur_sorted.
Plot met ur_sorted unempl_rate op de y-as en date op de x-as.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# unpivot everything besides the year column
ur_tall = ____


# Create a date column using the month and year columns of ur_tall
ur_tall['date'] = pd.to_datetime(ur_tall['____'] + '-' + ____)

# Sort ur_tall by date in ascending order
ur_sorted = ____

# Plot the unempl_rate by date
ur_sorted.plot(____)
plt.show()

Code bewerken en uitvoeren