Eliminare i dati mancanti
Hai visto che il tasso di interesse (int_rate) nell’insieme di dati loan_data dipende dal cliente. Purtroppo alcune osservazioni non hanno il tasso di interesse. Ora devi identificare quante misurazioni del tasso mancano e poi eliminarle.
In questo esercizio userai la funzione which() per creare un indice delle righe che contengono un NA. Userai poi questo indice per eliminare le righe con NA.
Questo esercizio fa parte del corso
Credit Risk Modeling in R
Istruzioni dell'esercizio
- Dai un’occhiata al numero di valori mancanti per la variabile
int_rateusando summary(). - Usa
which()eis.na()per creare un indice delle osservazioni senza un tasso di interesse registrato. Salva il risultato nell’oggettona_index. - Crea un nuovo insieme di dati chiamato
loan_data_delrow_na, che non contenga le osservazioni con tassi di interesse mancanti. - Ricorda che abbiamo fatto una copia di
loan_datachiamataloan_data_delcol_na. Invece di eliminare le osservazioni con tassi di interesse mancanti, elimina l’intera colonnaint_rateimpostandola aNULL.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Look at summary of loan_data
# Get indices of missing interest rates: na_index
na_index <-
# Remove observations with missing interest rates: loan_data_delrow_na
___ <- loan_data[-___, ]
# Make copy of loan_data
loan_data_delcol_na <- loan_data
# Delete interest rate column from loan_data_delcol_na