Nach Unternehmen filtern
Mit demselben Datensatz aus der letzten Übung ist dir aufgefallen, dass dich nur Jobs auf Einstiegsniveau ("EN") in Kanada ("CA") interessieren. Wie sehen dort die Gehälter aus?
Denk daran: In deinem Workspace gibt es bereits eine SparkSession namens spark!
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Filtere den DataFrame auf Zeilen, bei denen
company_location"CA"ist. - Berechne den Durchschnitt der Spalte
salary_in_usd. - Zeige das Ergebnis an!
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
== "EN").groupBy().____("salary_in_usd")
# Show the result
CA_jobs.____()