Top e bottom coding degli stipendi della Casa Bianca
Il top e bottom coding ci permettono di nascondere i valori anomali e ridurre il rischio di identificazione senza compromettere l’utilità dei dati.
In questo esercizio userai i dati sugli stipendi della Casa Bianca USA per gli anni 2019 e 2020. Applica la tecnica di top e bottom coding alla colonna salary.
Comincerai esplorando gli stipendi, per vedere come la maggior parte dei valori si concentra al centro della distribuzione. In base all’esplorazione, sceglierai valori ragionevoli per il top e il bottom coding.
Il DataFrame è caricato come wh2020.
Questo esercizio fa parte del corso
Riservatezza dei dati e anonimizzazione in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Plot a histogram of salaries
____
plt.show()