Acquisition de données JSON avec pandas
Lorsque vous développez un pipeline de données, vous pouvez être amené à travailler avec des données et des sources de données non tabulaires, telles que des fichiers APIou JSON. Dans cet exercice, nous allons nous entraîner à extraire des données d'un fichier JSON en utilisant pandas.
pandas a été importé sous le nom de pd, et le fichier JSON que vous allez ingérer est stocké sous le chemin "testing_scores.json".
Cet exercice fait partie du cours
ETL et ELT en Python
Instructions
- Mise à jour de la fonction
extract()lire un fichier JSON dans un DataFramepandas, en l'orientant par enregistrements. - Passez le chemin
testing_scores.jsonà la fonctionextract()et stockez le résultat dans une variable appeléeraw_testing_scores. - Imprimez la tête du DataFrame
raw_testing_scores.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
def extract(file_path):
# Read the JSON file into a DataFrame
return pd.____(____, orient="____")
# Call the extract function with the appropriate path, assign to raw_testing_scores
____
# Output the head of the DataFrame
print(raw_testing_scores.____())