ComenzarEmpieza gratis

Aprovechar las micro-particiones y el data clustering

En una charla rápida en el pasillo con tu Lead Data Engineer, te comentó que Snowflake está usando data clustering para ordenar los datos dentro de las micro-particiones por el campo year de la tabla olympic_medals. Sueles ejecutar varias consultas sobre esta tabla y te gustaría actualizarlas para aprovechar mejor las micro-particiones y el data clustering de Snowflake.

La función create_engine del módulo sqlalchemy ya se ha importado y se ha creado un objeto de conexión almacenado en la variable conn.

Este ejercicio forma parte del curso

Introducción a NoSQL

Ver curso

Instrucciones del ejercicio

  • Actualiza la consulta de Snowflake para que solo devuelva registros de los juegos que tuvieron lugar en 2000 o más tarde.
  • Devuelve los resultados de la consulta de Snowflake como un DataFrame de pandas e imprime el conjunto de resultados.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Leverage the existing micro-partitions and data clustering
query = """
SELECT
	team,
    year,
    sport,
    event,
    medal
FROM olympic_medals
____ year >= ____;
"""

# Execute the query, print the results
results = conn.cursor().____(query).fetch_pandas_all()
print(____)
Editar y ejecutar código