Top dan bottom coding untuk gaji White House
Top dan bottom coding memungkinkan kita menyembunyikan pencilan dan mengurangi risiko identifikasi tanpa mengurangi kegunaan data.
Dalam latihan ini, Anda akan menggunakan data gaji dari White House AS untuk tahun 2019 dan 2020. Terapkan teknik top dan bottom pada kolom salary.
Anda akan mulai dengan mengeksplorasi gaji untuk melihat bagaimana sebagian besar nilai berada di tengah distribusi. Berdasarkan eksplorasi tersebut, Anda akan memilih nilai top dan bottom coding yang wajar.
DataFrame telah dimuat sebagai wh2020.
Latihan ini adalah bagian dari kursus
Privasi Data dan Anonimisasi di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Plot a histogram of salaries
____
plt.show()