Removendo dados ausentes
Você já substituiu dados ausentes em person_emp_length, mas, no exercício anterior, viu que loan_int_rate também tem dados ausentes.
Assim como ter dados ausentes em loan_status, ter dados ausentes em loan_int_rate vai dificultar as previsões.
Como as taxas de juros são definidas pela sua empresa, ter valores ausentes nessa coluna é bem estranho. É possível que problemas na ingestão de dados tenham gerado erros, mas não dá para saber ao certo. Por agora, o melhor é usar .drop() para remover esses registros antes de seguir em frente.
O conjunto de dados cr_loan já foi carregado no workspace.
Este exercício faz parte do curso
Modelagem de Risco de Crédito em Python
Instruções do exercício
- Imprima o número de registros que contêm dados ausentes para a taxa de juros.
- Crie um array de índices das linhas que contêm taxa de juros ausente chamado indices.
- Remova os registros com taxa de juros ausente e salve o resultado em
cr_loan_clean.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print the number of nulls
print(____[____].____().____())
# Store the array on indices
____ = ____[____[____].____].____
# Save the new data without missing data
____ = ____.____(____)