Aan de slagGa gratis aan de slag

Top- en bottom-coding van salarissen in het Witte Huis

Top- en bottom-coding helpen ons uitschieters te verbergen en het risico op identificatie te verkleinen, zonder de bruikbaarheid van de data te verminderen.

In deze oefening ga je salarissen uit het Witte Huis in de VS gebruiken van de jaren 2019 en 2020. Pas de top- en bottom-coding techniek toe op de kolom salary.

Je begint met het verkennen van de salarissen, zodat je ziet dat het grootste deel van de waarden in het midden van de verdeling ligt. Op basis van je verkenning kies je redelijke top- en bottom-codewaarden.

De DataFrame is geladen als wh2020.

Deze oefening maakt deel uit van de cursus

Dataprivacy en anonimisering in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Plot a histogram of salaries
____
plt.show()
Code bewerken en uitvoeren