ComenzarEmpieza gratis

Top and bottom coding en los salarios de la Casa Blanca

El top y bottom coding nos permiten ocultar valores atípicos y reducir el riesgo de identificación sin perder utilidad en los datos.

En este ejercicio, vas a usar datos salariales de la Casa Blanca de EE. UU. de los años 2019 y 2020. Aplica la técnica de top y bottom coding a la columna salary.

Empezarás explorando los salarios para ver cómo la mayoría de los valores se concentran en el centro de la distribución. Con base en tu exploración, seleccionarás valores razonables para el top y bottom coding.

El DataFrame está cargado como wh2020.

Este ejercicio forma parte del curso

Privacidad de datos y anonimización en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Plot a histogram of salaries
____
plt.show()
Editar y ejecutar código