IniziaInizia gratis

Rimozione dei dati mancanti

Hai sostituito i dati mancanti in person_emp_length, ma nell'esercizio precedente hai visto che anche loan_int_rate ha dati mancanti.

Come per i dati mancanti in loan_status, avere dati mancanti in loan_int_rate renderà le previsioni difficili.

Poiché i tassi di interesse sono impostati dalla tua azienda, avere dati mancanti in questa colonna è molto strano. È possibile che problemi di acquisizione dei dati abbiano generato errori, ma non puoi saperlo con certezza. Per ora, è meglio .drop() questi record prima di proseguire.

L'insieme di dati cr_loan è stato caricato nell'ambiente di lavoro.

Questo esercizio fa parte del corso

Credit Risk Modeling in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Stampa il numero di record che contengono dati mancanti per il tasso di interesse.
  • Crea un array di indici per le righe che contengono il tasso di interesse mancante chiamato indices.
  • Elimina i record con dati mancanti sul tasso di interesse e salva i risultati in cr_loan_clean.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Print the number of nulls
print(____[____].____().____())

# Store the array on indices
____ = ____[____[____].____].____

# Save the new data without missing data
____ = ____.____(____)
Modifica ed esegui il codice