Aproveitamento de micropartições e agrupamento de dados
Durante uma rápida conversa no corredor com a engenheira líder de dados, ela compartilhou com você que o Snowflake está usando o clustering de dados para classificar os dados dentro das micropartições pelo campo year
na tabela olympic_medals
. Você tem algumas consultas que executa regularmente nessa tabela e que gostaria de atualizar para aproveitar melhor as micropartições e o clustering de dados do Snowflake.
A função create_engine
do módulo sqlalchemy
foi importada, e um objeto de conexão foi criado e armazenado na variável conn
.
Este exercício faz parte do curso
Introdução ao NoSQL
Instruções de exercício
- Atualize a consulta Snowflake para que ela retorne apenas os registros de jogos que ocorreram a partir de 2000.
- Retorne os resultados da consulta Snowflake como um
pandas
DataFrame
e imprima o conjunto de resultados.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Leverage the existing micro-partitions and data clustering
query = """
SELECT
team,
year,
sport,
event,
medal
FROM olympic_medals
____ year >= ____;
"""
# Execute the query, print the results
results = conn.cursor().____(query).fetch_pandas_all()
print(____)