CommencerCommencer gratuitement

Explorer le jeu de données Jobs

Dans cet exercice, vous allez explorer le nouveau DataFrame jobs, qui contient le taux de chômage de différents secteurs aux États-Unis entre 2000 et 2010. Comme vous le verrez, le jeu de données comporte des séries temporelles pour 16 secteurs et 122 points temporels (un par mois sur 10 ans). En général, le déroulé type d’un projet de Data Science implique du nettoyage et de l’exploration de données ; nous allons donc commencer par lire les données et vérifier la présence de valeurs manquantes.

Cet exercice fait partie du cours

Visualiser des séries temporelles en Python

Afficher le cours

Instructions

Nous avons importé pandas sous le nom pd.

  • Lisez le fichier CSV situé à url_jobs dans un DataFrame nommé jobs et examinez le type de chaque colonne.
  • Convertissez la colonne datestamp de jobs au type datetime.
  • Définissez la colonne datestamp comme index de jobs.
  • Affichez le nombre de valeurs manquantes dans chaque colonne de jobs.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Read in jobs file
jobs = ____

# Print first five lines of your DataFrame
print(jobs.head(5))

# Check the type of each column in your DataFrame
print(jobs.dtypes)

# Convert datestamp column to a datetime object
jobs[____] = ____(jobs[____])

# Set the datestamp columns as the index of your DataFrame
jobs = ____('datestamp')

# Check the number of missing values in each column
print(jobs.isnull().____())
Modifier et exécuter le code