Aprovechar las microparticiones y la agrupación de datos
Durante una rápida charla en el pasillo con tu Ingeniero Jefe de Datos, te contó que Snowflake está utilizando la agrupación de datos para ordenar los datos dentro de las microparticiones por el campo year
de la tabla olympic_medals
. Tienes algunas consultas que ejecutas regularmente en esta tabla, que te gustaría actualizar para aprovechar mejor las microparticiones y la agrupación de datos de Snowflake.
Se ha importado la función create_engine
del módulo sqlalchemy
y se ha creado un objeto de conexión que se almacena en la variable conn
.
Este ejercicio forma parte del curso
Introducción al NoSQL
Instrucciones de ejercicio
- Actualiza la consulta Snowflake para que sólo devuelva los registros de los partidos que tuvieron lugar en el año 2000 posterior.
- Devuelve los resultados de la consulta Snowflake como
pandas
DataFrame
, e imprime el conjunto de resultados.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Leverage the existing micro-partitions and data clustering
query = """
SELECT
team,
year,
sport,
event,
medal
FROM olympic_medals
____ year >= ____;
"""
# Execute the query, print the results
results = conn.cursor().____(query).fetch_pandas_all()
print(____)