De gegevensset verkennen
In deze cursus ga je een gegevensset analyseren met verkeerscontroles in Rhode Island, verzameld door het Stanford Open Policing Project.
Voordat je begint met analyseren, is het belangrijk dat je de gegevensset leert kennen. In deze oefening lees je de gegevensset in met pandas, bekijk je de eerste paar rijen en tel je vervolgens het aantal missende waarden.
Deze oefening maakt deel uit van de cursus
Politie-activiteit analyseren met pandas
Oefeninstructies
- Importeer
pandasmet de aliaspd. - Lees het bestand
police.csvin een DataFrame met de naamri. - Bekijk de eerste 5 rijen van het DataFrame (ook wel de "head").
- Tel het aantal missende waarden per kolom: gebruik
.isnull()om te checken welke elementen in het DataFrame ontbreken en neem daarna de.sum()om het aantalTrue-waarden per kolom te tellen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the pandas library as pd
import ____ as ____
# Read 'police.csv' into a DataFrame named ri
ri = pd.____(____)
# Examine the head of the DataFrame
print(ri.____)
# Count the number of missing values in each column
print(ri.isnull().____)