Aprovechar las micro-particiones y el data clustering
En una charla rápida en el pasillo con tu Lead Data Engineer, te comentó que Snowflake está usando data clustering para ordenar los datos dentro de las micro-particiones por el campo year de la tabla olympic_medals. Sueles ejecutar varias consultas sobre esta tabla y te gustaría actualizarlas para aprovechar mejor las micro-particiones y el data clustering de Snowflake.
La función create_engine del módulo sqlalchemy ya se ha importado y se ha creado un objeto de conexión almacenado en la variable conn.
Este ejercicio forma parte del curso
Introducción a NoSQL
Instrucciones del ejercicio
- Actualiza la consulta de Snowflake para que solo devuelva registros de los juegos que tuvieron lugar en 2000 o más tarde.
- Devuelve los resultados de la consulta de Snowflake como un
DataFramedepandase imprime el conjunto de resultados.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Leverage the existing micro-partitions and data clustering
query = """
SELECT
team,
year,
sport,
event,
medal
FROM olympic_medals
____ year >= ____;
"""
# Execute the query, print the results
results = conn.cursor().____(query).fetch_pandas_all()
print(____)