Mikro-bölümler ve veri kümelemeyi kullanma
Koridorda Lead Data Engineer'ınla yaptığın kısa sohbette, Snowflake'in olympic_medals tablosunda mikro-bölümler içinde veriyi year alanına göre sıralamak için veri kümeleme kullandığını öğrendin. Bu tablo üzerinde düzenli olarak çalıştırdığın birkaç sorgun var ve bunları Snowflake'in mikro-bölümleri ile veri kümelemesinden daha iyi yararlanacak şekilde güncellemek istiyorsun.
sqlalchemy modülünden create_engine fonksiyonu içe aktarıldı ve bir bağlantı nesnesi oluşturulup conn değişkeninde saklandı.
Bu egzersiz
NoSQL'a Giriş
kursunun bir parçasıdırEgzersiz talimatları
- Snowflake sorgusunu, 2000 ve sonrasında gerçekleşen oyunlara ait kayıtları döndürecek şekilde güncelle.
- Snowflake sorgusunun sonuçlarını bir
pandasDataFrameolarak döndür ve sonuç kümesini yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Leverage the existing micro-partitions and data clustering
query = """
SELECT
team,
year,
sport,
event,
medal
FROM olympic_medals
____ year >= ____;
"""
# Execute the query, print the results
results = conn.cursor().____(query).fetch_pandas_all()
print(____)