1. Learn
  2. /
  3. Courses
  4. /
  5. Nettoyage des données en Python

Connected

Exercise

Données numériques ou... ?

Dans cet exercice, et tout au long de ce chapitre, vous allez travailler avec des données de partage de vélos à San Francisco appelées ride_sharing. Elles contiennent des renseignements sur les stations de départ et d’arrivée, la durée du trajet, ainsi que certaines informations sur les usagers d’un service de vélopartage.

La colonne user_type indique si un usager fait un trajet gratuit et prend les valeurs suivantes :

  • 1 pour les trajets gratuits.
  • 2 pour le paiement à l’usage.
  • 3 pour les abonnements mensuels.

Ici, vous allez afficher les informations de ride_sharing au moyen de .info() et voir concrètement comment un type de données incorrect peut fausser l’analyse d’un jeu de données. Le module pandas est importé sous le nom pd.

Instructions 1/3

undefined XP
    1
    2
    3
  • Affichez les informations de ride_sharing.
  • Utilisez .describe() pour afficher les statistiques sommaires de la colonne user_type de ride_sharing.