Beyaz Saray maaşlarında üst ve alt kodlama
Üst ve alt kodlama, aykırı değerleri gizlememize ve veri faydasını azaltmadan kimlik tespiti riskini düşürmemize olanak tanır.
Bu egzersizde, 2019 ve 2020 yıllarına ait ABD Beyaz Saray maaş verilerini kullanacaksın. salary sütunu için üst ve alt kodlama tekniğini uygula.
Önce maaşları keşfederek dağılımın ortasında değerlerin yoğunlaştığını göreceksin. Bu keşfe dayanarak makul üst ve alt kod değerlerini seçeceksin.
DataFrame wh2020 olarak yüklendi.
Bu egzersiz
Python ile Veri Gizliliği ve Anonimleştirme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Plot a histogram of salaries
____
plt.show()