Memanfaatkan mikro-partisi dan data clustering
Saat mengobrol singkat di lorong dengan Lead Data Engineer Anda, ia memberi tahu bahwa Snowflake menggunakan data clustering untuk mengurutkan data dalam mikro-partisi berdasarkan kolom year pada tabel olympic_medals. Anda memiliki beberapa kueri yang rutin dijalankan terhadap tabel ini, dan Anda ingin memperbaruinya agar lebih maksimal memanfaatkan mikro-partisi dan data clustering Snowflake.
Fungsi create_engine dari modul sqlalchemy telah diimpor, dan sebuah objek koneksi telah dibuat serta disimpan dalam variabel conn.
Latihan ini adalah bagian dari kursus
Pengantar NoSQL
Petunjuk latihan
- Perbarui kueri Snowflake agar hanya mengembalikan rekaman untuk pertandingan yang berlangsung pada tahun 2000 ke atas.
- Kembalikan hasil kueri Snowflake sebagai
DataFramepandas, lalu cetak himpunan hasilnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Leverage the existing micro-partitions and data clustering
query = """
SELECT
team,
year,
sport,
event,
medal
FROM olympic_medals
____ year >= ____;
"""
# Execute the query, print the results
results = conn.cursor().____(query).fetch_pandas_all()
print(____)