Utiliser .melt() pour remodeler les données gouvernementales
Le Bureau of Labor Statistics (BLS) des États-Unis fournit souvent des séries de données dans un format facile à lire : chaque mois est présenté dans une colonne distincte et chaque année dans une ligne différente. Malheureusement, ce format large rend difficile la représentation graphique de ces informations dans le temps. Dans cet exercice, vous allez remodeler un tableau contenant les données du BLS sur le taux de chômage aux États-Unis afin de pouvoir le représenter sous forme de graphique à l'aide de .melt()
. Vous devrez ajouter une colonne « date » à la table et la trier pour que les données soient correctement représentées.
Les données relatives au taux de chômage ont été chargées pour vous dans une table appelée ur_wide
. Nous vous invitons à consulter cette table avant de commencer l'exercice.
Cet exercice fait partie du cours
Joindre des données avec pandas
Instructions
- Utilisez
.melt()
pour dépivoter toutes les colonnes deur_wide
à l'exception deyear
et veillez à ce que les colonnes contenant les mois et les valeurs soient respectivement nomméesmonth
etunempl_rate
. Enregistrez le résultat sousur_tall
. - Ajoutez une colonne à
ur_tall
nomméedate
qui combine les colonnesyear
etmonth
au format année-mois dans une chaîne plus grande et la convertit en un type de données de type date. - Triez
ur_tall
par date et enregistrez sousur_sorted
. - En utilisant
ur_sorted
, tracezunempl_rate
sur l'axe des y etdate
sur l'axe des x.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# unpivot everything besides the year column
ur_tall = ____
# Create a date column using the month and year columns of ur_tall
ur_tall['date'] = pd.to_datetime(ur_tall['____'] + '-' + ____)
# Sort ur_tall by date in ascending order
ur_sorted = ____
# Plot the unempl_rate by date
ur_sorted.plot(____)
plt.show()