Ingesta de datos JSON con pandas
Al desarrollar una canalización de datos, es posible que tengas que trabajar con datos y fuentes de datos no tabulares, como API o archivos JSON. En este ejercicio, practicaremos la extracción de datos de un archivo JSON utilizando pandas.
pandas se ha importado como pd, y el archivo JSON que vas a ingestar está almacenado en la ruta "testing_scores.json".
Este ejercicio forma parte del curso
ETL y ELT en Python
Instrucciones del ejercicio
- Actualiza la función
extract()para leer un archivo JSON en un DataFramepandas, orientándolo por registros. - Pasa la ruta
testing_scores.jsona la funciónextract(), y almacena la salida en una variable llamadaraw_testing_scores. - Imprime el encabezado del DataFrame
raw_testing_scores.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def extract(file_path):
# Read the JSON file into a DataFrame
return pd.____(____, orient="____")
# Call the extract function with the appropriate path, assign to raw_testing_scores
____
# Output the head of the DataFrame
print(raw_testing_scores.____())