Prima occhiata ai dati censurati
Sei la/il lead data scientist del governo nazionale di un piccolo paese chiamato Data Land. Stai contribuendo a scrivere la legge sulla durata dei mandati presidenziali. Poiché il tuo paese si affida ai dati per ogni decisione, cerchi indicazioni in un DataFrame di 1808 regimi in 202 paesi, chiamato regime_durations. Quanto tendono a durare i regimi? Il destino del tuo paese è racchiuso tra le righe e nelle tue mani…
Il tuo obiettivo è calcolare la durata media. Poiché stai usando un insieme di dati time-to-event, dovrai ispezionarlo per verificare la presenza di censura.
Il pacchetto pandas è caricato come pd. Il DataFrame delle durate è caricato e memorizzato come regime_durations. Puoi usare la console per visualizzare i nomi delle colonne del DataFrame.
Questo esercizio fa parte del corso
Analisi di sopravvivenza in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print first row
print(regime_durations.____)
# Count censored data
count = len(regime_durations[regime_durations[____] == ____])
# Print the count to console
print(____)