Filtrar por empresa
Usando el mismo conjunto de datos del ejercicio anterior, te das cuenta de que solo te interesan los puestos de nivel inicial ("EN") en Canadá ("CA"). ¿Cómo son los salarios allí?
¡Recuerda que ya tienes una SparkSession llamada spark en tu espacio de trabajo!
Este ejercicio forma parte del curso
Introducción a PySpark
Instrucciones del ejercicio
- Filtra el DataFrame para quedarte con las filas donde
company_locationsea"CA". - Calcula la media de la columna
salary_in_usd. - ¡Muestra el resultado!
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Average salary for entry level in Canada
CA_jobs = ca_salaries_df.____(ca_salaries_df[____] == "CA").filter(ca_salaries_df['experience_level']
== "EN").groupBy().____("salary_in_usd")
# Show the result
CA_jobs.____()