Top and bottom coding en los salarios de la Casa Blanca
El top y bottom coding nos permiten ocultar valores atípicos y reducir el riesgo de identificación sin perder utilidad en los datos.
En este ejercicio, vas a usar datos salariales de la Casa Blanca de EE. UU. de los años 2019 y 2020. Aplica la técnica de top y bottom coding a la columna salary.
Empezarás explorando los salarios para ver cómo la mayoría de los valores se concentran en el centro de la distribución. Con base en tu exploración, seleccionarás valores razonables para el top y bottom coding.
El DataFrame está cargado como wh2020.
Este ejercicio forma parte del curso
Privacidad de datos y anonimización en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Plot a histogram of salaries
____
plt.show()