CommencerCommencer gratuitement

Données numériques ou…?

Dans cet exercice, et tout au long de ce chapitre, vous travaillerez avec des données relatives au partage de vélos à San Francisco, ride_sharing. L’ensemble contient des informations sur les stations de départ et d'arrivée, la durée du trajet et certaines informations utilisateur pour un service de vélos en libre-service.

La colonne user_type contient des informations indiquant si un utilisateur bénéficie d'un accès gratuit et accepte les valeurs suivantes :

  • 1 pour les utilisateurs bénéficiant d’un accès gratuit.
  • 2 pour un paiement par trajet.
  • 3 pour les abonnés mensuels.

Dans ce cas, vous afficherez les informations de ride_sharing à l'aide de .info() et vous verrez un exemple concret de la façon dont un type de données incorrect peut fausser votre analyse de l'ensemble de données. Le package pandas est importé sous le nom pd.

Cet exercice fait partie du cours

Nettoyage des données en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print the information of ride_sharing
print(____.____())

# Print summary statistics of user_type column
print(ride_sharing['____'].____())
Modifier et exécuter le code