1. Learn
  2. /
  3. Courses
  4. /
  5. Čištění dat v Pythonu

Connected

Exercise

Číselná data, nebo ... ?

V tomto cvičení, a v celé této kapitole, budeš pracovat s daty o sdílení jízdních kol v San Franciscu uloženými v proměnné ride_sharing. Dataset obsahuje informace o výchozích a cílových stanicích, délce jízdy a některé údaje o uživatelích služby sdílení kol.

Sloupec user_type obsahuje informaci o tom, jaký typ uživatele se přepravoval, a nabývá těchto hodnot:

  • 1 pro uživatele s bezplatnou jízdou.
  • 2 pro uživatele platící za každou jízdu.
  • 3 pro měsíční předplatitele.

V tomto cvičení vypíšeš informace o datasetu ride_sharing pomocí .info() a na vlastní oči uvidíš, jak nesprávný datový typ může zkreslit analýzu dat. Balíček pandas je importován jako pd.

Instructions 1/3

undefined XP
    1
    2
    3
  • Vypiš informace o datasetu ride_sharing.
  • Pomocí .describe() vypiš souhrnné statistiky sloupce user_type z datasetu ride_sharing.