Top e bottom coding em salários da Casa Branca
Top e bottom coding permitem esconder outliers e reduzir o risco de identificação sem perder a utilidade dos dados.
Neste exercício, você vai usar dados de salários da Casa Branca dos Estados Unidos dos anos de 2019 e 2020. Aplique a técnica de top e bottom na coluna salary.
Você vai começar explorando os salários para ver como a maior parte dos valores está concentrada no centro da distribuição. Com base nessa exploração, você vai selecionar valores razoáveis para top e bottom coding.
O DataFrame já está carregado como wh2020.
Este exercício faz parte do curso
Privacidade de Dados e Anonimização em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Plot a histogram of salaries
____
plt.show()