ComeçarComece gratuitamente

Remoção de dados ausentes

Você substituiu os dados ausentes em person_emp_length, mas no exercício anterior você viu que loan_int_rate também tem dados ausentes.

Da mesma forma que a falta de dados em loan_status, a falta de dados em loan_int_rate dificultará as previsões.

Como as taxas de juros são definidas pela sua empresa, é muito estranho que você tenha dados ausentes nessa coluna. É possível que problemas de ingestão de dados tenham criado erros, mas você não pode ter certeza. Por enquanto, é melhor você acessar .drop() esses registros antes de seguir em frente.

O conjunto de dados cr_loan foi carregado no espaço de trabalho.

Este exercício faz parte do curso

Modelagem de risco de crédito em Python

Ver Curso

Instruções de exercício

  • Imprima o número de registros que contêm dados ausentes para a taxa de juros.
  • Crie uma matriz de índices para linhas que contenham taxas de juros ausentes, chamada de índices.
  • Elimine os registros com dados de taxa de juros ausentes e salve os resultados em cr_loan_clean.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Print the number of nulls
print(____[____].____().____())

# Store the array on indices
____ = ____[____[____].____].____

# Save the new data without missing data
____ = ____.____(____)
Editar e executar código