Gebruikmaken van micro-partities en dataclustering

Tijdens een kort gesprek op de gang met je Lead Data Engineer vertelde ze je dat Snowflake dataclustering gebruikt om gegevens binnen micro-partities te sorteren op het veld year in de tabel olympic_medals. Je hebt een paar queries die je regelmatig op deze tabel uitvoert en die je wilt bijwerken om beter te profiteren van Snowflake's micro-partities en dataclustering.

De functie create_engine uit de module sqlalchemy is geïmporteerd, en er is een connectieobject aangemaakt en opgeslagen in de variabele conn.

Deze oefening maakt deel uit van de cursus

Introductie tot NoSQL

Bekijk cursus

Oefeninstructies

Werk de Snowflake-query bij zodat alleen records worden geretourneerd voor spelen die in 2000 of later plaatsvonden.
Geef de resultaten van de Snowflake-query terug als een pandas-DataFrame, en print de resultset.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Leverage the existing micro-partitions and data clustering
query = """
SELECT
	team,
    year,
    sport,
    event,
    medal
FROM olympic_medals
____ year >= ____;
"""

# Execute the query, print the results
results = conn.cursor().____(query).fetch_pandas_all()
print(____)

Code bewerken en uitvoeren