1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Čištění dat v Pythonu

Connected

Cvičení

Sčítání řetězců a zřetězení čísel

V předchozím cvičení jsi zjistil/a, že správným datovým typem pro sloupec user_type je category, a provedl/a převod, díky kterému bylo možné získat užitečné statistické přehledy o rozložení hodnot user_type.

Další častý problém s datovými typy nastává, když se číselné hodnoty při importu načtou jako řetězce – matematické operace jako součet nebo násobení pak vedou ke zřetězení řetězců místo číselných výsledků.

V tomto cvičení převedeš sloupec duration z typu str na typ int. Nejprve ale budeš muset z hodnot ve sloupci odstranit text "minutes", aby je pandas správně rozpoznal jako čísla. Balíček pandas je už naimportovaný pod názvem pd.

Pokyny

100 XP
  • Pomocí metody .strip() odstraň z hodnot sloupce duration text "minutes" a výsledek ulož do sloupce duration_trim.
  • Převeď sloupec duration_trim na typ int a výsledek ulož do sloupce duration_time.
  • Napiš příkaz assert, který ověří, zda je datový typ sloupce duration_time nyní int.
  • Vypiš průměrnou délku jízdy.