CommencerCommencer gratuitement

Ingérer des données JSON avec pandas

Lorsque vous développez un pipeline de données, vous pouvez être amené à travailler avec des données non tabulaires et des sources de données, telles que des API ou des fichiers JSON. Dans cet exercice, nous allons nous entraîner à extraire des données d'un fichier JSON à l'aide de pandas.

pandas a été importé sous le nom de pd, et le fichier JSON que vous allez ingérer est stocké sous le chemin "testing_scores.json".

Cet exercice fait partie du cours

ETL et ELT en Python

Afficher le cours

Instructions

  • Mettez à jour la fonction extract() pour lire un fichier JSON dans un DataFrame pandas, en l'orientant par enregistrements.
  • Passez le chemin testing_scores.json à la fonction extract() et stockez le résultat dans une variable appelée raw_testing_scores.
  • Affichez l’en-tête du DataFrame raw_testing_scores.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

def extract(file_path):
  # Read the JSON file into a DataFrame
  return pd.____(____, orient="____")

# Call the extract function with the appropriate path, assign to raw_testing_scores
____

# Output the head of the DataFrame
print(raw_testing_scores.____())
Modifier et exécuter le code