CommencerCommencer gratuitement

Utiliser .melt() pour remodeler les données gouvernementales

Le Bureau of Labor Statistics (BLS) des États-Unis fournit souvent des séries de données dans un format facile à lire : chaque mois est présenté dans une colonne distincte et chaque année dans une ligne différente. Malheureusement, ce format large rend difficile la représentation graphique de ces informations dans le temps. Dans cet exercice, vous allez remodeler un tableau contenant les données du BLS sur le taux de chômage aux États-Unis afin de pouvoir le représenter sous forme de graphique à l'aide de .melt(). Vous devrez ajouter une colonne « date » à la table et la trier pour que les données soient correctement représentées.

Les données relatives au taux de chômage ont été chargées pour vous dans une table appelée ur_wide. Nous vous invitons à consulter cette table avant de commencer l'exercice.

Cet exercice fait partie du cours

Joindre des données avec pandas

Afficher le cours

Instructions

  • Utilisez .melt() pour dépivoter toutes les colonnes de ur_wide à l'exception de year et veillez à ce que les colonnes contenant les mois et les valeurs soient respectivement nommées month et unempl_rate. Enregistrez le résultat sous ur_tall.
  • Ajoutez une colonne à ur_tall nommée date qui combine les colonnes year et month au format année-mois dans une chaîne plus grande et la convertit en un type de données de type date.
  • Triez ur_tall par date et enregistrez sous ur_sorted.
  • En utilisant ur_sorted, tracez unempl_rate sur l'axe des y et date sur l'axe des x.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# unpivot everything besides the year column
ur_tall = ____


# Create a date column using the month and year columns of ur_tall
ur_tall['date'] = pd.to_datetime(ur_tall['____'] + '-' + ____)

# Sort ur_tall by date in ascending order
ur_sorted = ____

# Plot the unempl_rate by date
ur_sorted.plot(____)
plt.show()
Modifier et exécuter le code