ComeçarComece de graça

Top e bottom coding em salários da Casa Branca

Top e bottom coding permitem esconder outliers e reduzir o risco de identificação sem perder a utilidade dos dados.

Neste exercício, você vai usar dados de salários da Casa Branca dos Estados Unidos dos anos de 2019 e 2020. Aplique a técnica de top e bottom na coluna salary.

Você vai começar explorando os salários para ver como a maior parte dos valores está concentrada no centro da distribuição. Com base nessa exploração, você vai selecionar valores razoáveis para top e bottom coding.

O DataFrame já está carregado como wh2020.

Este exercício faz parte do curso

Privacidade de Dados e Anonimização em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Plot a histogram of salaries
____
plt.show()
Editar e executar o código