Filtrando por empresa
Usando o mesmo conjunto de dados do exercício anterior, você percebeu que só se importa com vagas de nível iniciante ("EN") no Canadá ("CA"). Como ficam os salários por lá?
Lembre-se de que já existe uma SparkSession chamada spark no seu ambiente!
Este exercício faz parte do curso
Introdução ao PySpark
Instruções do exercício
- Filtre para manter apenas as linhas do DataFrame em que
company_locationé"CA". - Calcule a média da coluna
salary_in_usd. - Mostre o resultado!
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
== "EN").groupBy().____("salary_in_usd")
# Show the result
CA_jobs.____()