CommencerCommencer gratuitement

Filtrer par entreprise

En utilisant le même jeu de données que dans l’exercice précédent, vous réalisez que vous ne vous intéressez qu’aux postes débutants ("EN") au Canada ("CA"). À quoi ressemblent les salaires dans ce cas ? Rappelez-vous qu’une SparkSession appelée spark est déjà disponible dans votre espace de travail !

Cet exercice fait partie du cours

Introduction à PySpark

Afficher le cours

Instructions

  • Filtrez pour restreindre le DataFrame aux lignes où company_location vaut "CA".
  • Calculez la moyenne de la colonne salary_in_usd.
  • Affichez le résultat !

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
 == "EN").groupBy().____("salary_in_usd")

# Show the result
CA_jobs.____()
Modifier et exécuter le code