Estrazione di dati da file parquet
Uno dei modi più comuni per acquisire dati da un sistema sorgente è leggere i dati da un file, ad esempio un file CSV. Con l’aumento delle dimensioni dei dati, l’esigenza di formati migliori ha portato alla nascita di nuovi formati di file orientati alle colonne, come i file parquet.
In questo esercizio, metterai in pratica l’estrazione di dati da un file parquet.
Questo esercizio fa parte del corso
ETL and ELT in Python
Istruzioni dell'esercizio
- Leggi il file parquet nel percorso
"sales_data.parquet"in un DataFramepandas. - Controlla i tipi di dato del DataFrame usando
print(). - Visualizza la forma del DataFrame e anche le sue prime righe (head).
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
import pandas as pd
# Read the sales data into a DataFrame
sales_data = pd.____("____", engine="fastparquet")
# Check the data type of the columns of the DataFrames
print(sales_data.____)
# Print the shape of the DataFrame, as well as the head
print(sales_data.____)
print(sales_data.____())