MulaiMulai sekarang secara gratis

Top dan bottom coding untuk gaji White House

Top dan bottom coding memungkinkan kita menyembunyikan pencilan dan mengurangi risiko identifikasi tanpa mengurangi kegunaan data.

Dalam latihan ini, Anda akan menggunakan data gaji dari White House AS untuk tahun 2019 dan 2020. Terapkan teknik top dan bottom pada kolom salary.

Anda akan mulai dengan mengeksplorasi gaji untuk melihat bagaimana sebagian besar nilai berada di tengah distribusi. Berdasarkan eksplorasi tersebut, Anda akan memilih nilai top dan bottom coding yang wajar.

DataFrame telah dimuat sebagai wh2020.

Latihan ini adalah bagian dari kursus

Privasi Data dan Anonimisasi di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Plot a histogram of salaries
____
plt.show()
Edit dan Jalankan Kode