Filteren op bedrijf
Met dezelfde gegevensset uit de vorige oefening kom je erachter dat je alleen geïnteresseerd bent in banen op instapniveau ("EN") in Canada ("CA"). Hoe zien de salarissen daar eruit?
Onthoud dat er al een SparkSession met de naam spark in je werkruimte staat!
Deze oefening maakt deel uit van de cursus
Introductie tot PySpark
Oefeninstructies
- Filter het DataFrame zodat
company_locationgelijk is aan"CA". - Bereken het gemiddelde van de kolom
salary_in_usd. - Laat het resultaat zien!
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
== "EN").groupBy().____("salary_in_usd")
# Show the result
CA_jobs.____()