MulaiMulai sekarang secara gratis

Memanfaatkan mikro-partisi dan data clustering

Saat mengobrol singkat di lorong dengan Lead Data Engineer Anda, ia memberi tahu bahwa Snowflake menggunakan data clustering untuk mengurutkan data dalam mikro-partisi berdasarkan kolom year pada tabel olympic_medals. Anda memiliki beberapa kueri yang rutin dijalankan terhadap tabel ini, dan Anda ingin memperbaruinya agar lebih maksimal memanfaatkan mikro-partisi dan data clustering Snowflake.

Fungsi create_engine dari modul sqlalchemy telah diimpor, dan sebuah objek koneksi telah dibuat serta disimpan dalam variabel conn.

Latihan ini adalah bagian dari kursus

Pengantar NoSQL

Lihat Kursus

Petunjuk latihan

  • Perbarui kueri Snowflake agar hanya mengembalikan rekaman untuk pertandingan yang berlangsung pada tahun 2000 ke atas.
  • Kembalikan hasil kueri Snowflake sebagai DataFrame pandas, lalu cetak himpunan hasilnya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Leverage the existing micro-partitions and data clustering
query = """
SELECT
	team,
    year,
    sport,
    event,
    medal
FROM olympic_medals
____ year >= ____;
"""

# Execute the query, print the results
results = conn.cursor().____(query).fetch_pandas_all()
print(____)
Edit dan Jalankan Kode