Estrazione di dati da file parquet

Uno dei modi più comuni per acquisire dati da un sistema sorgente è leggere i dati da un file, ad esempio un file CSV. Con l’aumento delle dimensioni dei dati, l’esigenza di formati migliori ha portato alla nascita di nuovi formati di file orientati alle colonne, come i file parquet.

In questo esercizio, metterai in pratica l’estrazione di dati da un file parquet.

Questo esercizio fa parte del corso

ETL and ELT in Python

Visualizza corso

Istruzioni dell'esercizio

Leggi il file parquet nel percorso "sales_data.parquet" in un DataFrame pandas.
Controlla i tipi di dato del DataFrame usando print().
Visualizza la forma del DataFrame e anche le sue prime righe (head).

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

import pandas as pd

# Read the sales data into a DataFrame
sales_data = pd.____("____", engine="fastparquet")

# Check the data type of the columns of the DataFrames
print(sales_data.____)

# Print the shape of the DataFrame, as well as the head
print(sales_data.____)
print(sales_data.____())

Modifica ed esegui il codice