Explorer le jeu de données Jobs
Dans cet exercice, vous allez explorer le nouveau DataFrame jobs, qui contient le taux de chômage de différents secteurs aux États-Unis entre 2000 et 2010. Comme vous le verrez, le jeu de données comporte des séries temporelles pour 16 secteurs et 122 points temporels (un par mois sur 10 ans). En général, le déroulé type d’un projet de Data Science implique du nettoyage et de l’exploration de données ; nous allons donc commencer par lire les données et vérifier la présence de valeurs manquantes.
Cet exercice fait partie du cours
Visualiser des séries temporelles en Python
Instructions
Nous avons importé pandas sous le nom pd.
- Lisez le fichier CSV situé à
url_jobsdans un DataFrame nomméjobset examinez le type de chaque colonne. - Convertissez la colonne
datestampdejobsau typedatetime. - Définissez la colonne
datestampcomme index dejobs. - Affichez le nombre de valeurs manquantes dans chaque colonne de
jobs.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Read in jobs file
jobs = ____
# Print first five lines of your DataFrame
print(jobs.head(5))
# Check the type of each column in your DataFrame
print(jobs.dtypes)
# Convert datestamp column to a datetime object
jobs[____] = ____(jobs[____])
# Set the datestamp columns as the index of your DataFrame
jobs = ____('datestamp')
# Check the number of missing values in each column
print(jobs.isnull().____())