Ingérer des données JSON avec pandas
Lorsque vous développez un pipeline de données, vous pouvez être amené à travailler avec des données non tabulaires et des sources de données, telles que des API ou des fichiers JSON. Dans cet exercice, nous allons nous entraîner à extraire des données d'un fichier JSON à l'aide de pandas.
pandas a été importé sous le nom de pd, et le fichier JSON que vous allez ingérer est stocké sous le chemin "testing_scores.json".
Cet exercice fait partie du cours
ETL et ELT en Python
Instructions
- Mettez à jour la fonction
extract()pour lire un fichier JSON dans un DataFramepandas, en l'orientant par enregistrements. - Passez le chemin
testing_scores.jsonà la fonctionextract()et stockez le résultat dans une variable appeléeraw_testing_scores. - Affichez l’en-tête du DataFrame
raw_testing_scores.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
def extract(file_path):
# Read the JSON file into a DataFrame
return pd.____(____, orient="____")
# Call the extract function with the appropriate path, assign to raw_testing_scores
____
# Output the head of the DataFrame
print(raw_testing_scores.____())