Filtrando por empresa
Usando o mesmo conjunto de dados do exercício anterior, você percebeu que só se importa com vagas de nível iniciante ("EN") no Canadá ("CA"). Como ficam os salários por lá?
Lembre-se de que já existe uma SparkSession chamada spark no seu ambiente!
Este exercicio faz parte do curso
Introdução ao PySpark
Instruções do exercicio
- Filtre para manter apenas as linhas do DataFrame em que
company_locationé"CA". - Calcule a média da coluna
salary_in_usd. - Mostre o resultado!
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
== "EN").groupBy().____("salary_in_usd")
# Show the result
CA_jobs.____()