Aan de slagGa gratis aan de slag

Eerste blik op gecensureerde data

Je bent de lead data scientist bij de nationale overheid van een klein land genaamd Data Land. Je helpt bij het schrijven van de wet over hoe lang presidentstermijnen mogen duren. Omdat je land voor elke beslissing op data vertrouwt, zoek je wijsheid in een DataFrame met 1808 regimes uit 202 landen, genaamd regime_durations. Hoe lang duren regimes doorgaans? Het lot van je land ligt tussen de rijen — en in jouw handen…

Je doel is om de gemiddelde duur te berekenen. Omdat je met een time-to-event-gegevensset werkt, moet je de data inspecteren om te controleren op censurering.

Het pandas-pakket is als pd geladen. De durations-DataFrame is geladen en opgeslagen als regime_durations. Je kunt de console gebruiken om de kolomnamen van de DataFrame te bekijken.

Deze oefening maakt deel uit van de cursus

Survivalanalyse in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print first row
print(regime_durations.____)

# Count censored data
count = len(regime_durations[regime_durations[____] == ____])

# Print the count to console
print(____)
Code bewerken en uitvoeren