1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în PySpark

Connected

exercițiu

Interogări pe un view temporar

În acest exercițiu, vei exersa înregistrarea unui DataFrame ca view SQL temporar în PySpark. View-urile temporare sunt instrumente foarte utile: îți permit să interoghezi date folosind sintaxa SQL, ceea ce face manipulările complexe de date mai simple și mai intuitive. Scopul tău este să creezi un view dintr-un DataFrame furnizat și să rulezi interogări SQL asupra lui – o sarcină comună în lucrul cu ETL și ELT.

Ai deja un SparkContext, spark, și un DataFrame PySpark, df, disponibile în spațiul de lucru.

Instrucțiuni

100 XP
  • Înregistrează un view nou numit "data_view" din DataFrame-ul df.
  • Rulează interogarea SQL furnizată pentru a calcula salariul total pe poziție.