Remoção de dados ausentes
Você substituiu os dados ausentes em person_emp_length
, mas no exercício anterior você viu que loan_int_rate
também tem dados ausentes.
Da mesma forma que a falta de dados em loan_status
, a falta de dados em loan_int_rate
dificultará as previsões.
Como as taxas de juros são definidas pela sua empresa, é muito estranho que você tenha dados ausentes nessa coluna. É possível que problemas de ingestão de dados tenham criado erros, mas você não pode ter certeza. Por enquanto, é melhor você acessar .drop()
esses registros antes de seguir em frente.
O conjunto de dados cr_loan
foi carregado no espaço de trabalho.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções de exercício
- Imprima o número de registros que contêm dados ausentes para a taxa de juros.
- Crie uma matriz de índices para linhas que contenham taxas de juros ausentes, chamada de índices.
- Elimine os registros com dados de taxa de juros ausentes e salve os resultados em
cr_loan_clean
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Print the number of nulls
print(____[____].____().____())
# Store the array on indices
____ = ____[____[____].____].____
# Save the new data without missing data
____ = ____.____(____)