ComeçarComece gratuitamente

Aproveitamento de micropartições e agrupamento de dados

Durante uma rápida conversa no corredor com a engenheira líder de dados, ela compartilhou com você que o Snowflake está usando o clustering de dados para classificar os dados dentro das micropartições pelo campo year na tabela olympic_medals. Você tem algumas consultas que executa regularmente nessa tabela e que gostaria de atualizar para aproveitar melhor as micropartições e o clustering de dados do Snowflake.

A função create_engine do módulo sqlalchemy foi importada, e um objeto de conexão foi criado e armazenado na variável conn.

Este exercício faz parte do curso

Introdução ao NoSQL

Ver Curso

Instruções de exercício

  • Atualize a consulta Snowflake para que ela retorne apenas os registros de jogos que ocorreram a partir de 2000.
  • Retorne os resultados da consulta Snowflake como um pandas DataFrame e imprima o conjunto de resultados.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Leverage the existing micro-partitions and data clustering
query = """
SELECT
	team,
    year,
    sport,
    event,
    medal
FROM olympic_medals
____ year >= ____;
"""

# Execute the query, print the results
results = conn.cursor().____(query).fetch_pandas_all()
print(____)
Editar e executar código