Verificando valores ausentes
Identificar valores ausentes é essencial para a análise. Usando o mesmo conjunto de dados, você vai obter o número total de valores ausentes iterando tanto pelas linhas quanto pelas colunas do conjunto de dados. Ao encontrar valores ausentes, métodos adicionais são necessários para tratá-los, como usar Imputer do sklearn. Valores ausentes precisam ser tratados; caso contrário, será difícil fazer uma previsão de CTR adequada.
Os dados de amostra em formato de DataFrame estão carregados como df. pandas como pd também está disponível no seu workspace.
Este exercício faz parte do curso
Prevendo CTR com Machine Learning em Python
Instruções do exercício
- Imprima um resumo básico das colunas usando
.info(). - Imprima os valores ausentes por coluna usando
.isnull()(não se esqueça dos parênteses!). - Imprima o número total de valores ausentes por linha usando
axis = 1e.sum().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print info
print(df.____)
# Print missing values by column
print(df.____.sum(____ = 0))
# Print total number of missing values in rows
print(df.____.sum(____ = 1).____)