Erster Blick auf zensierte Daten

Du bist der leitende Data Scientist bei der Nationalregierung eines kleinen Landes namens Datenland. Du hilfst dabei, das Gesetz zu verfassen, wie lange eine Präsidentschaft dauern soll. Da dein Land bei jeder Entscheidung auf Daten angewiesen ist, suchst du nach Weisheit aus einem DataFrame von 1808 Regimen in 202 Ländern, genannt regime_durations. Wie lange dauern die Regime in der Regel? Das Schicksal deines Landes liegt zwischen den Zeilen und in deinen Händen…

Dein Ziel ist es, die durchschnittliche Dauer zu berechnen. Da du einen Zeit-bis-zum-Ereignis-Datensatz verwendest, musst du die Daten untersuchen, um sie auf Zensierung zu prüfen.

Das pandas-Paket wird als pd geladen. Der DataFrame mit den Angaben zur Dauer wird geladen und als regime_durations gespeichert. Du kannst die Konsole verwenden, um die Spaltennamen des DataFrames anzuzeigen.

Diese Übung ist Teil des Kurses

Überlebenszeitanalyse in Python

Kurs anzeigen

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Print first row
print(regime_durations.____)

# Count censored data
count = len(regime_durations[regime_durations[____] == ____])

# Print the count to console
print(____)