Créer des données hebdomadaires à partir du taux de chômage mensuel
Le taux de chômage civil aux États-Unis est publié chaque mois. Vous pouvez avoir besoin de données plus fréquentes, mais ce n’est pas un problème puisque vous venez d’apprendre à suréchantillonner une série temporelle.
Vous allez travailler sur les données de séries temporelles des 20 dernières années et appliquer quelques options pour remplir les valeurs manquantes avant de tracer la série hebdomadaire.
Cet exercice fait partie du cours
Manipuler des séries temporelles en Python
Instructions
Nous avons déjà importé pandas sous le nom pd et matplotlib.pyplot sous le nom plt.
- Utilisez
pd.read_csv()pour importer'unemployment.csv', en créant unDateTimeIndexà partir de la colonne'date'avecparse_datesetindex_col, et affectez le résultat àdata. - Convertissez
dataen fréquence hebdomadaire avec.asfreq()et l’alias'W', puis affichez les cinq premières lignes. - Convertissez à nouveau en fréquence hebdomadaire, en ajoutant l’option
'bfill', et affichez les cinq premières lignes. - Créez une série hebdomadaire en ajoutant cette fois l’option
'ffill', affectez-la àweekly_ffillet affichez les cinq premières lignes. - Tracez
weekly_ffillà partir de 2015.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import data here
data = ____
# Show first five rows of weekly series
print(____)
# Show first five rows of weekly series with bfill option
print(____)
# Create weekly series with ffill option and show first five rows
weekly_ffill = ____
print(____)
# Plot weekly_fill starting 2015 here