ComeçarComece de graça

Excluindo dados ausentes

Você viu antes que a taxa de juros (int_rate) no conjunto de dados loan_data depende do cliente. Infelizmente, algumas observações estão sem taxa de juros. Agora você precisa identificar quantas taxas de juros estão ausentes e, em seguida, excluí-las.

Neste exercício, você vai usar a função which() para criar um índice das linhas que contêm um NA. Depois, você usará esse índice para excluir as linhas com NAs.

Este exercício faz parte do curso

Modelagem de Risco de Crédito em R

Ver curso

Instruções do exercício

  • Veja a quantidade de entradas ausentes para a variável int_rate usando summary().
  • Use which() e is.na() para criar um índice das observações sem taxa de juros registrada. Armazene o resultado no objeto na_index.
  • Crie um novo conjunto de dados chamado loan_data_delrow_na, que não contenha as observações com taxas de juros ausentes.
  • Lembre-se de que fizemos uma cópia de loan_data chamada loan_data_delcol_na. Em vez de excluir as observações com taxas de juros ausentes, exclua a coluna inteira int_rate definindo-a como NULL.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Look at summary of loan_data


# Get indices of missing interest rates: na_index
na_index <- 

# Remove observations with missing interest rates: loan_data_delrow_na
___ <- loan_data[-___, ]

# Make copy of loan_data
loan_data_delcol_na <- loan_data

# Delete interest rate column from loan_data_delcol_na
Editar e executar o código