1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în PySpark

Connected

exercițiu

Numere întregi în UDF-uri PySpark

Acest exercițiu abordează UDF-urile și te ajută să înțelegi cum se creează funcții în PySpark! Pe măsură ce lucrezi la el, gândește-te cum ar putea înlocui pași dintr-un flux de curățare a datelor.

Reține că în spațiul tău de lucru există deja o SparkSession numită spark!

Instrucțiuni

100 XP
  • Înregistrează funcția age_category ca UDF cu numele age_category_udf.
  • Adaugă o coloană nouă în DataFrame-ul df, numită "category", care aplică UDF-ul pentru a categoriza persoanele în funcție de vârstă. Argumentul pentru age_category_udf() este deja furnizat.
  • Afișează DataFrame-ul rezultat.