CommencerCommencer gratuitement

Données numériques ou ... ?

Dans cet exercice, et tout au long de ce chapitre, vous travaillerez avec des données relatives au partage de vélos à San Francisco, disponibles à l'adresse ride_sharing. Il contient des informations sur les stations de départ et d'arrivée, la durée du trajet et certaines informations utilisateur pour un service de vélos en libre-service.

La colonne « user_type » (Utilisation gratuite) indique si un utilisateur bénéficie d'un trajet gratuit et peut prendre les valeurs suivantes :

  • 1 pour les personnes qui profitent du service sans y contribuer.
  • 2 pour un paiement par trajet.
  • 3 pour les abonnés mensuels.

Dans ce cas, vous imprimerez les informations de ride_sharing à l'aide de .info() et verrez un exemple concret de la façon dont un type de données incorrect peut fausser votre analyse de l'ensemble de données. Le package pandas est importé sous le nom pd.

Cet exercice fait partie du cours

Nettoyage des données dans Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print the information of ride_sharing
print(____.____())

# Print summary statistics of user_type column
print(ride_sharing['____'].____())
Modifier et exécuter le code