Filtrare per azienda
Usando lo stesso dataset dell'esercizio precedente, ti sei reso conto che ti interessano solo i lavori di livello iniziale ("EN") in Canada ("CA"). Come sono gli stipendi lì?
Ricorda: nel tuo workspace c'è già una SparkSession chiamata spark!
Questo esercizio fa parte del corso
Introduzione a PySpark
Istruzioni dell'esercizio
- Applica un filtro per ottenere il sottoinsieme del DataFrame in cui
company_locationè"CA". - Calcola la media della colonna
salary_in_usd. - Mostra il risultato!
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
== "EN").groupBy().____("salary_in_usd")
# Show the result
CA_jobs.____()