IniziaInizia gratis

Eliminare i dati mancanti

Hai visto che il tasso di interesse (int_rate) nell’insieme di dati loan_data dipende dal cliente. Purtroppo alcune osservazioni non hanno il tasso di interesse. Ora devi identificare quante misurazioni del tasso mancano e poi eliminarle.

In questo esercizio userai la funzione which() per creare un indice delle righe che contengono un NA. Userai poi questo indice per eliminare le righe con NA.

Questo esercizio fa parte del corso

Credit Risk Modeling in R

Visualizza il corso

Istruzioni dell'esercizio

  • Dai un’occhiata al numero di valori mancanti per la variabile int_rate usando summary().
  • Usa which() e is.na() per creare un indice delle osservazioni senza un tasso di interesse registrato. Salva il risultato nell’oggetto na_index.
  • Crea un nuovo insieme di dati chiamato loan_data_delrow_na, che non contenga le osservazioni con tassi di interesse mancanti.
  • Ricorda che abbiamo fatto una copia di loan_data chiamata loan_data_delcol_na. Invece di eliminare le osservazioni con tassi di interesse mancanti, elimina l’intera colonna int_rate impostandola a NULL.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Look at summary of loan_data


# Get indices of missing interest rates: na_index
na_index <- 

# Remove observations with missing interest rates: loan_data_delrow_na
___ <- loan_data[-___, ]

# Make copy of loan_data
loan_data_delcol_na <- loan_data

# Delete interest rate column from loan_data_delcol_na
Modifica ed esegui il codice