ComenzarEmpieza gratis

Cómo tratar datos faltantes con fill y drop

¡Vaya…! ¡Este conjunto de datos tiene muchos valores faltantes! ¡Vamos a limpiarlo! Con el archivo CSV cargado, elimina las filas que tengan cualquier valor nulo y muestra los resultados.

Recuerda que ya tienes una SparkSession llamada spark en tu espacio de trabajo.

Este ejercicio forma parte del curso

Introducción a PySpark

Ver curso

Instrucciones del ejercicio

  • Elimina cualquier fila con valores nulos en el DataFrame census_df.
  • Muestra el DataFrame resultante.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Drop rows with any nulls
census_cleaned = census_df.____

# Show the result
census_cleaned.____
Editar y ejecutar código