Quão esparsos estão meus dados?
A maioria dos conjuntos de dados contém valores ausentes, geralmente representados como NaN (Not a Number). Se você estiver trabalhando com Pandas, dá para verificar facilmente quantos valores ausentes existem em cada coluna.
Vamos descobrir quantos desenvolvedores que responderam à pesquisa escolheram informar sua idade (na coluna Age de so_survey_df) e seu gênero (coluna Gender de so_survey_df).
Este exercício faz parte do curso
Feature Engineering for Machine Learning in Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Subset the DataFrame
sub_df = ____
# Print the number of non-missing values
print(sub_df.____)