Sfruttare micro-partizioni e data clustering

Durante una chiacchierata veloce in corridoio con la tua Lead Data Engineer, ti ha detto che Snowflake sta usando il data clustering per ordinare i dati all'interno delle micro-partizioni in base al campo year nella tabella olympic_medals. Hai alcune query che esegui regolarmente su questa tabella e che vorresti aggiornare per sfruttare meglio le micro-partizioni e il data clustering di Snowflake.

La funzione create_engine del modulo sqlalchemy è stata importata e un oggetto connessione è stato creato e memorizzato nella variabile conn.

Questo esercizio fa parte del corso

Introduzione ai database NoSQL

Visualizza corso

Istruzioni dell'esercizio

Aggiorna la query Snowflake per restituire solo i record dei giochi che si sono svolti dal 2000 in poi.
Restituisci i risultati della query Snowflake come DataFrame di pandas e stampa il set di risultati.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Leverage the existing micro-partitions and data clustering
query = """
SELECT
	team,
    year,
    sport,
    event,
    medal
FROM olympic_medals
____ year >= ____;
"""

# Execute the query, print the results
results = conn.cursor().____(query).fetch_pandas_all()
print(____)

Modifica ed esegui il codice