Aan de slagGa gratis aan de slag

Filteren op bedrijf

Met dezelfde gegevensset uit de vorige oefening kom je erachter dat je alleen geïnteresseerd bent in banen op instapniveau ("EN") in Canada ("CA"). Hoe zien de salarissen daar eruit? Onthoud dat er al een SparkSession met de naam spark in je werkruimte staat!

Deze oefening maakt deel uit van de cursus

Introductie tot PySpark

Cursus bekijken

Oefeninstructies

  • Filter het DataFrame zodat company_location gelijk is aan "CA".
  • Bereken het gemiddelde van de kolom salary_in_usd.
  • Laat het resultaat zien!

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
 == "EN").groupBy().____("salary_in_usd")

# Show the result
CA_jobs.____()
Code bewerken en uitvoeren