Sfruttare micro-partizioni e data clustering
Durante una chiacchierata veloce in corridoio con la tua Lead Data Engineer, ti ha detto che Snowflake sta usando il data clustering per ordinare i dati all'interno delle micro-partizioni in base al campo year nella tabella olympic_medals. Hai alcune query che esegui regolarmente su questa tabella e che vorresti aggiornare per sfruttare meglio le micro-partizioni e il data clustering di Snowflake.
La funzione create_engine del modulo sqlalchemy è stata importata e un oggetto connessione è stato creato e memorizzato nella variabile conn.
Questo esercizio fa parte del corso
Introduzione ai database NoSQL
Istruzioni dell'esercizio
- Aggiorna la query Snowflake per restituire solo i record dei giochi che si sono svolti dal 2000 in poi.
- Restituisci i risultati della query Snowflake come
DataFramedipandase stampa il set di risultati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Leverage the existing micro-partitions and data clustering
query = """
SELECT
team,
year,
sport,
event,
medal
FROM olympic_medals
____ year >= ____;
"""
# Execute the query, print the results
results = conn.cursor().____(query).fetch_pandas_all()
print(____)