Aan de slagGa gratis aan de slag

Numerieke data of ... ?

In deze oefening, en de rest van dit hoofdstuk, werk je met gegevens van een deelfietsdienst in San Francisco, ride_sharing. Deze gegevens bevatten informatie over de begin- en eindstations, de ritduur en enkele gebruikersgegevens voor de deelfietsdienst.

De kolom user_type geeft aan of een gebruiker gratis rijdt en heeft de volgende waarden:

  • 1 voor gratis rijders.
  • 2 voor betalen per rit.
  • 3 voor maandabonnees.

In dit geval ga je de informatie van ride_sharing afdrukken met .info() en uit eerste hand zien hoe een onjuist gegevenstype je analyse van de gegevensset kan verstoren. Het pakket pandas is geïmporteerd als pd.

Deze oefening maakt deel uit van de cursus

Data opschonen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print the information of ride_sharing
print(____.____())

# Print summary statistics of user_type column
print(ride_sharing['____'].____())
Code bewerken en uitvoeren