IniziaInizia gratis

Filtrare per azienda

Usando lo stesso dataset dell'esercizio precedente, ti sei reso conto che ti interessano solo i lavori di livello iniziale ("EN") in Canada ("CA"). Come sono gli stipendi lì? Ricorda: nel tuo workspace c'è già una SparkSession chiamata spark!

Questo esercizio fa parte del corso

Introduzione a PySpark

Visualizza il corso

Istruzioni dell'esercizio

  • Applica un filtro per ottenere il sottoinsieme del DataFrame in cui company_location è "CA".
  • Calcola la media della colonna salary_in_usd.
  • Mostra il risultato!

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
 == "EN").groupBy().____("salary_in_usd")

# Show the result
CA_jobs.____()
Modifica ed esegui il codice