ComeçarComece de graça

Aproveitando micro-partitions e data clustering

Durante uma conversa rápida no corredor com sua Lead Data Engineer, ela compartilhou que o Snowflake está usando data clustering para ordenar os dados dentro das micro-partitions pelo campo year na tabela olympic_medals. Você tem algumas consultas que executa regularmente nessa tabela e gostaria de atualizá-las para aproveitar melhor as micro-partitions e o data clustering do Snowflake.

A função create_engine do módulo sqlalchemy já foi importada, e um objeto de conexão foi criado e armazenado na variável conn.

Este exercício faz parte do curso

Introdução a NoSQL

Ver curso

Instruções do exercício

  • Atualize a consulta do Snowflake para retornar apenas os registros de jogos que ocorreram em 2000 em diante.
  • Retorne os resultados da consulta do Snowflake como um DataFrame do pandas e imprima o conjunto de resultados.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Leverage the existing micro-partitions and data clustering
query = """
SELECT
	team,
    year,
    sport,
    event,
    medal
FROM olympic_medals
____ year >= ____;
"""

# Execute the query, print the results
results = conn.cursor().____(query).fetch_pandas_all()
print(____)
Editar e executar o código