IniziaInizia gratis

Top e bottom coding degli stipendi della Casa Bianca

Il top e bottom coding ci permettono di nascondere i valori anomali e ridurre il rischio di identificazione senza compromettere l’utilità dei dati.

In questo esercizio userai i dati sugli stipendi della Casa Bianca USA per gli anni 2019 e 2020. Applica la tecnica di top e bottom coding alla colonna salary.

Comincerai esplorando gli stipendi, per vedere come la maggior parte dei valori si concentra al centro della distribuzione. In base all’esplorazione, sceglierai valori ragionevoli per il top e il bottom coding.

Il DataFrame è caricato come wh2020.

Questo esercizio fa parte del corso

Riservatezza dei dati e anonimizzazione in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Plot a histogram of salaries
____
plt.show()
Modifica ed esegui il codice