Cómo tratar datos faltantes con fill y drop
¡Vaya…! ¡Este conjunto de datos tiene muchos valores faltantes! ¡Vamos a limpiarlo! Con el archivo CSV cargado, elimina las filas que tengan cualquier valor nulo y muestra los resultados.
Recuerda que ya tienes una SparkSession llamada spark en tu espacio de trabajo.
Este ejercicio forma parte del curso
Introducción a PySpark
Instrucciones del ejercicio
- Elimina cualquier fila con valores nulos en el DataFrame
census_df. - Muestra el DataFrame resultante.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Drop rows with any nulls
census_cleaned = census_df.____
# Show the result
census_cleaned.____