Gebruikmaken van micro-partities en dataclustering
Tijdens een kort gesprek op de gang met je Lead Data Engineer vertelde ze je dat Snowflake dataclustering gebruikt om gegevens binnen micro-partities te sorteren op het veld year in de tabel olympic_medals. Je hebt een paar queries die je regelmatig op deze tabel uitvoert en die je wilt bijwerken om beter te profiteren van Snowflake's micro-partities en dataclustering.
De functie create_engine uit de module sqlalchemy is geïmporteerd, en er is een connectieobject aangemaakt en opgeslagen in de variabele conn.
Deze oefening maakt deel uit van de cursus
Introductie tot NoSQL
Oefeninstructies
- Werk de Snowflake-query bij zodat alleen records worden geretourneerd voor spelen die in 2000 of later plaatsvonden.
- Geef de resultaten van de Snowflake-query terug als een
pandas-DataFrame, en print de resultset.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Leverage the existing micro-partitions and data clustering
query = """
SELECT
team,
year,
sport,
event,
medal
FROM olympic_medals
____ year >= ____;
"""
# Execute the query, print the results
results = conn.cursor().____(query).fetch_pandas_all()
print(____)