Ingesta de datos JSON con pandas
Al desarrollar una canalización de datos, es posible que tengas que trabajar con datos y fuentes de datos no tabulares, como API o archivos JSON. En este ejercicio, practicaremos la extracción de datos de un archivo JSON utilizando pandas
.
pandas
se ha importado como pd
, y el archivo JSON que vas a ingestar está almacenado en la ruta "testing_scores.json"
.
Este ejercicio forma parte del curso
ETL y ELT en Python
Instrucciones del ejercicio
- Actualiza la función
extract()
para leer un archivo JSON en un DataFramepandas
, orientándolo por registros. - Pasa la ruta
testing_scores.json
a la funciónextract()
, y almacena la salida en una variable llamadaraw_testing_scores
. - Imprime el encabezado del DataFrame
raw_testing_scores
.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def extract(file_path):
# Read the JSON file into a DataFrame
return pd.____(____, orient="____")
# Call the extract function with the appropriate path, assign to raw_testing_scores
____
# Output the head of the DataFrame
print(raw_testing_scores.____())