JSON-gegevens inladen met pandas
Bij het ontwikkelen van een datapijplijn werk je soms met niet-tabulaire data en databronnen, zoals API’s of JSON-bestanden. In deze oefening ga je data uit een JSON-bestand extraheren met pandas.
pandas is geïmporteerd als pd, en het JSON-bestand dat je gaat inladen staat op het pad "testing_scores.json".
Deze oefening maakt deel uit van de cursus
ETL en ELT in Python
Oefeninstructies
- Werk de functie
extract()bij zodat deze een JSON-bestand inleest in eenpandasDataFrame, georiënteerd op records. - Geef het pad
testing_scores.jsondoor aan de functieextract(), en sla de output op in een variabeleraw_testing_scores. - Print de head van het DataFrame
raw_testing_scores.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
def extract(file_path):
# Read the JSON file into a DataFrame
return pd.____(____, orient="____")
# Call the extract function with the appropriate path, assign to raw_testing_scores
____
# Output the head of the DataFrame
print(raw_testing_scores.____())