Ingestão de dados JSON com o pandas
Ao desenvolver um pipeline de dados, você pode ter que trabalhar com dados não tabulares e fontes de dados, como APIs ou arquivos JSON. Neste exercício, vamos praticar a extração de dados de um arquivo JSON usando pandas
.
pandas
foi importado como pd
, e o arquivo JSON que você vai ingerir está armazenado no caminho "testing_scores.json"
.
Este exercício faz parte do curso
ETL e ELT em Python
Instruções do exercício
- Atualize a função
extract()
para ler um arquivo JSON em um DataFramepandas
, orientando por registros. - Passe o caminho
testing_scores.json
para a funçãoextract()
e armazene a saída em uma variável chamadaraw_testing_scores
. - Imprima a parte superior do DataFrame
raw_testing_scores
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def extract(file_path):
# Read the JSON file into a DataFrame
return pd.____(____, orient="____")
# Call the extract function with the appropriate path, assign to raw_testing_scores
____
# Output the head of the DataFrame
print(raw_testing_scores.____())