Questi valori sono missing at random?
Nel video hai visto che esistono vari tipi di mancanza dei dati (missingness). Ricapitolando, possiamo descriverli così:
- Missing Completely at Random: nessuna relazione sistematica tra i valori mancanti di una colonna e gli altri valori o i propri valori.
- Missing at Random: c’è una relazione sistematica tra i valori mancanti di una colonna e altri valori osservati.
- Missing not at Random: c’è una relazione sistematica tra i valori mancanti di una colonna e valori non osservati.
Hai un DataFrame con punteggi di soddisfazione dei clienti per un servizio. Che tipo di missingness rappresenta il seguente caso?
Una colonna satisfaction_score con valori mancanti per i clienti molto insoddisfatti.
Questo esercizio fa parte del corso
Pulizia dei dati in Python
Esercizio pratico interattivo
Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi
Inizia esercizio