Aan de slagBegin gratis

Numerieke data of ... ?

In deze oefening, en de rest van dit hoofdstuk, werk je met gegevens van een deelfietsdienst in San Francisco, ride_sharing. Deze gegevens bevatten informatie over de begin- en eindstations, de ritduur en enkele gebruikersgegevens voor de deelfietsdienst.

De kolom user_type geeft aan of een gebruiker gratis rijdt en heeft de volgende waarden:

  • 1 voor gratis rijders.
  • 2 voor betalen per rit.
  • 3 voor maandabonnees.

In dit geval ga je de informatie van ride_sharing afdrukken met .info() en uit eerste hand zien hoe een onjuist gegevenstype je analyse van de gegevensset kan verstoren. Het pakket pandas is geïmporteerd als pd.

Deze oefening maakt deel uit van de cursus

Data opschonen in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Print the information of ride_sharing
print(____.____())

# Print summary statistics of user_type column
print(ride_sharing['____'].____())
Code bewerken en uitvoeren