1. Learn
  2. /
  3. Kurser
  4. /
  5. Datarensning i Python

Connected

övning

Summera strängar och konkatenera tal

I föregående övning identifierade du att category är rätt datatyp för user_type och konverterade den för att få fram relevanta statistiska sammanfattningar om fördelningen av user_type.

Ett annat vanligt datatypsproblem är att värden som borde vara numeriska importeras som strängar. Det leder till att matematiska operationer som summering och multiplikation ger strängkonkatenering i stället för numeriska resultat.

I den här övningen konverterar du strängkolumnen duration till typen int. Innan dess behöver du se till att ta bort "minutes" från kolumnen, så att pandas tolkar den som numerisk. Paketet pandas har importerats som pd.

Instruktioner

100 XP
  • Använd metoden .strip() för att ta bort "minutes" från duration och lagra resultatet i kolumnen duration_trim.
  • Konvertera duration_trim till int och lagra resultatet i kolumnen duration_time.
  • Skriv ett assert-uttryck som kontrollerar att datatypen för duration_time nu är int.
  • Skriv ut den genomsnittliga resans längd.