Filtrer par entreprise
En utilisant le même jeu de données que dans l’exercice précédent, vous réalisez que vous ne vous intéressez qu’aux postes débutants ("EN") au Canada ("CA"). À quoi ressemblent les salaires dans ce cas ?
Rappelez-vous qu’une SparkSession appelée spark est déjà disponible dans votre espace de travail !
Cet exercice fait partie du cours
Introduction à PySpark
Instructions
- Filtrez pour restreindre le DataFrame aux lignes où
company_locationvaut"CA". - Calculez la moyenne de la colonne
salary_in_usd. - Affichez le résultat !
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
== "EN").groupBy().____("salary_in_usd")
# Show the result
CA_jobs.____()