Nach Unternehmen filtern
Als du den Datensatz aus der letzten Übung genutzt hast, hast du bemerkt, dass dich nur die Jobs auf Einstiegsniveau ("EN") in Kanada ("CA") interessieren. Wie sehen dort die Gehälter aus?
Denke daran: In deinem Workspace gibt es bereits eine SparkSession namens spark!
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Filtere den DataFrame auf Zeilen, in denen
company_location"CA"ist. - Berechne den Durchschnitt der Spalte
salary_in_usd. - Zeige das Ergebnis an!
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
== "EN").groupBy().____("salary_in_usd")
# Show the result
CA_jobs.____()