JSON-gegevens laden
Veel open dataportalen bieden JSON-gegevenssets aan die bijzonder makkelijk te parseren zijn. Je kunt er direct via een URL bij. Elk object is één record, alle objecten hebben dezelfde set attributen, en geen van de waarden zijn geneste objecten die je apart moet parsen.
De Daily Report van het New York City Department of Homeless Services is zo’n gegevensset, met tellingen van de bevolking in opvanglocaties over meerdere jaren. Je kunt deze eerst in de console bekijken voordat je hem met de read_json()-functie van pandas in een dataframe laadt.
Deze oefening maakt deel uit van de cursus
Gestroomlijnde data-inname met pandas
Oefeninstructies
- Krijg een idee van de inhoud van
dhs_daily_report.json, die in de console is afgedrukt. - Importeer
pandasalspd. - Gebruik
read_json()omdhs_daily_report.jsonin te laden in een dataframe,pop_in_shelters. - Bekijk samenvattende statistieken van
pop_in_sheltersmet dedescribe()-methode van de dataframe.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load pandas as pd
____
# Load the daily report to a dataframe
pop_in_shelters = ____
# View summary stats about pop_in_shelters
print(____)