Aan de slagGa gratis aan de slag

De gegevensset verkennen

In deze cursus ga je een gegevensset analyseren met verkeerscontroles in Rhode Island, verzameld door het Stanford Open Policing Project.

Voordat je begint met analyseren, is het belangrijk dat je de gegevensset leert kennen. In deze oefening lees je de gegevensset in met pandas, bekijk je de eerste paar rijen en tel je vervolgens het aantal missende waarden.

Deze oefening maakt deel uit van de cursus

Politie-activiteit analyseren met pandas

Cursus bekijken

Oefeninstructies

  • Importeer pandas met de alias pd.
  • Lees het bestand police.csv in een DataFrame met de naam ri.
  • Bekijk de eerste 5 rijen van het DataFrame (ook wel de "head").
  • Tel het aantal missende waarden per kolom: gebruik .isnull() om te checken welke elementen in het DataFrame ontbreken en neem daarna de .sum() om het aantal True-waarden per kolom te tellen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import the pandas library as pd
import ____ as ____

# Read 'police.csv' into a DataFrame named ri
ri = pd.____(____)

# Examine the head of the DataFrame
print(ri.____)

# Count the number of missing values in each column
print(ri.isnull().____)
Code bewerken en uitvoeren