Données numériques ou…?
Dans cet exercice, et tout au long de ce chapitre, vous travaillerez avec des données relatives au partage de vélos à San Francisco, ride_sharing. L’ensemble contient des informations sur les stations de départ et d'arrivée, la durée du trajet et certaines informations utilisateur pour un service de vélos en libre-service.
La colonne user_type contient des informations indiquant si un utilisateur bénéficie d'un accès gratuit et accepte les valeurs suivantes :
1pour les utilisateurs bénéficiant d’un accès gratuit.2pour un paiement par trajet.3pour les abonnés mensuels.
Dans ce cas, vous afficherez les informations de ride_sharing à l'aide de .info() et vous verrez un exemple concret de la façon dont un type de données incorrect peut fausser votre analyse de l'ensemble de données. Le package pandas est importé sous le nom pd.
Cet exercice fait partie du cours
Nettoyage des données en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Print the information of ride_sharing
print(____.____())
# Print summary statistics of user_type column
print(ride_sharing['____'].____())