1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do NoSQL

Connected

ćwiczenie

Wykorzystanie mikro-partycji i klastrowania danych

Podczas krótkiej rozmowy na korytarzu twoja Lead Data Engineer wspomniała, że Snowflake używa klastrowania danych do sortowania rekordów w mikro-partycjach według pola year w tabeli olympic_medals. Masz kilka zapytań, które regularnie wykonujesz na tej tabeli – chcesz je zaktualizować, aby lepiej wykorzystać mechanizm mikro-partycji i klastrowania danych w Snowflake.

Funkcja create_engine z modułu sqlalchemy została już zaimportowana, a obiekt połączenia jest dostępny w zmiennej conn.

Instrukcje

100 XP
  • Zaktualizuj zapytanie Snowflake tak, aby zwracało tylko rekordy dotyczące igrzysk, które odbyły się w roku 2000 lub później.
  • Zwróć wyniki zapytania Snowflake jako DataFrame biblioteki pandas i wydrukuj otrzymany zbiór wyników.