Aproveitando micro-partitions e data clustering
Durante uma conversa rápida no corredor com sua Lead Data Engineer, ela compartilhou que o Snowflake está usando data clustering para ordenar os dados dentro das micro-partitions pelo campo year na tabela olympic_medals. Você tem algumas consultas que executa regularmente nessa tabela e gostaria de atualizá-las para aproveitar melhor as micro-partitions e o data clustering do Snowflake.
A função create_engine do módulo sqlalchemy já foi importada, e um objeto de conexão foi criado e armazenado na variável conn.
Este exercício faz parte do curso
Introdução a NoSQL
Instruções do exercício
- Atualize a consulta do Snowflake para retornar apenas os registros de jogos que ocorreram em 2000 em diante.
- Retorne os resultados da consulta do Snowflake como um
DataFramedopandase imprima o conjunto de resultados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Leverage the existing micro-partitions and data clustering
query = """
SELECT
team,
year,
sport,
event,
medal
FROM olympic_medals
____ year >= ____;
"""
# Execute the query, print the results
results = conn.cursor().____(query).fetch_pandas_all()
print(____)