Erster Blick auf zensierte Daten
Du bist der leitende Data Scientist bei der Nationalregierung eines kleinen Landes namens Datenland. Du hilfst dabei, das Gesetz zu verfassen, wie lange eine Präsidentschaft dauern soll. Da dein Land bei jeder Entscheidung auf Daten angewiesen ist, suchst du nach Weisheit aus einem DataFrame von 1808
Regimen in 202
Ländern, genannt regime_durations
. Wie lange dauern die Regime in der Regel? Das Schicksal deines Landes liegt zwischen den Zeilen und in deinen Händen…
Dein Ziel ist es, die durchschnittliche Dauer zu berechnen. Da du einen Zeit-bis-zum-Ereignis-Datensatz verwendest, musst du die Daten untersuchen, um sie auf Zensierung zu prüfen.
Das pandas
-Paket wird als pd
geladen. Der DataFrame mit den Angaben zur Dauer wird geladen und als regime_durations
gespeichert. Du kannst die Konsole verwenden, um die Spaltennamen des DataFrames anzuzeigen.
Diese Übung ist Teil des Kurses
Überlebenszeitanalyse in Python
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Print first row
print(regime_durations.____)
# Count censored data
count = len(regime_durations[regime_durations[____] == ____])
# Print the count to console
print(____)