Rimozione dei dati mancanti
Hai sostituito i dati mancanti in person_emp_length, ma nell'esercizio precedente hai visto che anche loan_int_rate ha dati mancanti.
Come per i dati mancanti in loan_status, avere dati mancanti in loan_int_rate renderà le previsioni difficili.
Poiché i tassi di interesse sono impostati dalla tua azienda, avere dati mancanti in questa colonna è molto strano. È possibile che problemi di acquisizione dei dati abbiano generato errori, ma non puoi saperlo con certezza. Per ora, è meglio .drop() questi record prima di proseguire.
L'insieme di dati cr_loan è stato caricato nell'ambiente di lavoro.
Questo esercizio fa parte del corso
Credit Risk Modeling in Python
Istruzioni dell'esercizio
- Stampa il numero di record che contengono dati mancanti per il tasso di interesse.
- Crea un array di indici per le righe che contengono il tasso di interesse mancante chiamato indices.
- Elimina i record con dati mancanti sul tasso di interesse e salva i risultati in
cr_loan_clean.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print the number of nulls
print(____[____].____().____())
# Store the array on indices
____ = ____[____[____].____].____
# Save the new data without missing data
____ = ____.____(____)