1. Learn
  2. /
  3. Kurser
  4. /
  5. Datarensning i Python

Connected

övning

Numerisk data eller ... ?

I den här övningen, och genom hela det här kapitlet, kommer du att arbeta med cykeldelningsdata från San Francisco som kallas ride_sharing. Datamängden innehåller information om start- och slutstationer, resans längd och viss användarinformation för en cykeldelningstjänst.

Kolumnen user_type innehåller information om huruvida en användare åker gratis och har följande värden:

  • 1 för gratisresenärer.
  • 2 för betala per resa.
  • 3 för månadsabonnenter.

I den här övningen skriver du ut information om ride_sharing med .info() och ser ett konkret exempel på hur en felaktig datatyp kan påverka din analys av datamängden. Paketet pandas är importerat som pd.

Instruktioner 1/3

undefined XP
    1
    2
    3
  • Skriv ut information om ride_sharing.
  • Använd .describe() för att skriva ut sammanfattningsstatistik för kolumnen user_type i ride_sharing.