Numerieke data of ... ?
In deze oefening, en de rest van dit hoofdstuk, werk je met gegevens van een deelfietsdienst in San Francisco, ride_sharing. Deze gegevens bevatten informatie over de begin- en eindstations, de ritduur en enkele gebruikersgegevens voor de deelfietsdienst.
De kolom user_type geeft aan of een gebruiker gratis rijdt en heeft de volgende waarden:
1voor gratis rijders.2voor betalen per rit.3voor maandabonnees.
In dit geval ga je de informatie van ride_sharing afdrukken met .info() en uit eerste hand zien hoe een onjuist gegevenstype je analyse van de gegevensset kan verstoren. Het pakket pandas is geïmporteerd als pd.
Deze oefening maakt deel uit van de cursus
Data opschonen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print the information of ride_sharing
print(____.____())
# Print summary statistics of user_type column
print(ride_sharing['____'].____())