Ingérer des données JSON avec pandas
Lorsque vous développez un pipeline de données, vous pouvez être amené à travailler avec des données non tabulaires et des sources de données, telles que des API ou des fichiers JSON. Dans cet exercice, nous allons nous entraîner à extraire des données d'un fichier JSON à l'aide de pandas
.
pandas
a été importé sous le nom de pd
, et le fichier JSON que vous allez ingérer est stocké sous le chemin "testing_scores.json"
.
Cet exercice fait partie du cours
ETL et ELT en Python
Instructions
- Mettez à jour la fonction
extract()
pour lire un fichier JSON dans un DataFramepandas
, en l'orientant par enregistrements. - Passez le chemin
testing_scores.json
à la fonctionextract()
et stockez le résultat dans une variable appeléeraw_testing_scores
. - Affichez l’en-tête du DataFrame
raw_testing_scores
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
def extract(file_path):
# Read the JSON file into a DataFrame
return pd.____(____, orient="____")
# Call the extract function with the appropriate path, assign to raw_testing_scores
____
# Output the head of the DataFrame
print(raw_testing_scores.____())