Tratando valores ausentes com fill e drop
Puxa… Há muitos valores ausentes neste conjunto de dados! Vamos limpar isso! Com o arquivo CSV já carregado, remova as linhas que tenham qualquer valor nulo e mostre os resultados!
Lembre-se: já existe uma SparkSession chamada spark no seu ambiente!
Este exercício faz parte do curso
Introdução ao PySpark
Instruções do exercício
- Remova quaisquer linhas com valores nulos no DataFrame
census_df. - Mostre o DataFrame resultante.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Drop rows with any nulls
census_cleaned = census_df.____
# Show the result
census_cleaned.____