1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do PySpark

Connected

ćwiczenie

Zapytania na widoku tymczasowym

W tym ćwiczeniu przećwiczysz rejestrowanie DataFrame jako tymczasowego widoku SQL w PySpark. Widoki tymczasowe to przydatne narzędzia, które pozwalają odpytywać dane za pomocą składni SQL – dzięki temu złożone operacje na danych stają się prostsze i bardziej intuicyjne. Twoim celem jest utworzenie widoku na podstawie dostarczonego DataFrame i uruchomienie zapytań SQL – to typowe zadanie w pracy z ETL i ELT.

W środowisku pracy masz już dostępny SparkContext spark oraz PySpark DataFrame df.

Instrukcje

100 XP
  • Zarejestruj nowy widok o nazwie "data_view" na podstawie DataFrame df.
  • Uruchom dostarczone zapytanie SQL, aby obliczyć łączne wynagrodzenie według stanowiska.