ComeçarComece de graça

Removendo dados ausentes

Você já substituiu dados ausentes em person_emp_length, mas, no exercício anterior, viu que loan_int_rate também tem dados ausentes.

Assim como ter dados ausentes em loan_status, ter dados ausentes em loan_int_rate vai dificultar as previsões.

Como as taxas de juros são definidas pela sua empresa, ter valores ausentes nessa coluna é bem estranho. É possível que problemas na ingestão de dados tenham gerado erros, mas não dá para saber ao certo. Por agora, o melhor é usar .drop() para remover esses registros antes de seguir em frente.

O conjunto de dados cr_loan já foi carregado no workspace.

Este exercício faz parte do curso

Modelagem de Risco de Crédito em Python

Ver curso

Instruções do exercício

  • Imprima o número de registros que contêm dados ausentes para a taxa de juros.
  • Crie um array de índices das linhas que contêm taxa de juros ausente chamado indices.
  • Remova os registros com taxa de juros ausente e salve o resultado em cr_loan_clean.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Print the number of nulls
print(____[____].____().____())

# Store the array on indices
____ = ____[____[____].____].____

# Save the new data without missing data
____ = ____.____(____)
Editar e executar o código