1. Învăţa
  2. /
  3. Courses
  4. /
  5. Nettoyage des données en Python

Connected

exercise

Additionner des chaînes et concaténer des nombres

Dans l’exercice précédent, vous avez déterminé que category est le bon type de données pour user_type et vous l’avez converti afin d’extraire des statistiques pertinentes pour mieux comprendre la répartition de user_type.

Un autre problème fréquent de types de données consiste à importer comme chaînes de caractères des valeurs qui devraient être numériques; dans ce cas, des opérations comme l’addition ou la multiplication mènent à une concaténation de chaînes plutôt qu’à un résultat numérique.

Dans cet exercice, vous allez convertir la colonne duration, actuellement au format chaîne, en type int. Avant cela, vous devez retirer "minutes" de la colonne pour que pandas la reconnaisse comme numérique. Le module pandas a été importé sous l’alias pd.

Instrucţiuni

100 XP
  • Utilisez la méthode .strip() pour retirer "minutes" de duration et stockez le résultat dans la colonne duration_trim.
  • Convertissez duration_trim en int et stockez le résultat dans la colonne duration_time.
  • Écrivez une instruction assert qui vérifie que le type de donnée de duration_time est maintenant un int.
  • Affichez la durée moyenne des trajets.