Primeiro olhar sobre dados censurados
Você é o(a) cientista de dados líder no governo nacional de um pequeno país chamado Data Land. Você está ajudando a escrever a lei sobre quanto tempo as presidências devem durar. Como seu país se baseia em dados para cada decisão, você busca orientação em um DataFrame com 1808 regimes ao longo de 202 países, chamado regime_durations. Quanto tempo os regimes tendem a durar? O destino do seu país está entre as linhas — e nas suas mãos…
Seu objetivo é calcular a duração média. Como você está usando um conjunto de dados de tempo até o evento, será necessário inspecionar os dados para verificar se há censura.
O pacote pandas está carregado como pd. O DataFrame de durações está carregado e armazenado como regime_durations. Você pode usar o console para ver os nomes das colunas do DataFrame.
Este exercício faz parte do curso
Análise de Sobrevivência em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print first row
print(regime_durations.____)
# Count censored data
count = len(regime_durations[regime_durations[____] == ____])
# Print the count to console
print(____)