Veri dağılımını keşfet
Bir veri kümesini gerçeğe çok yakın bir şekilde örnekleyerek anonimleştirmek istediğimizde, veriye dair alan ve istatistik bilgisine ihtiyaç duyarız. Gördüğün gibi, ilgi duyulan sütunun olasılık dağılımını bulmak kritik önemdedir.
Bu egzersizde, IBM İK veri kümesinin basitleştirilmiş bir sürümündeki business_travel sütununu keşfedeceksin.
DataFrame hr olarak ve numpy np olarak içe aktarılmıştır. Önceki bölümde söylendiği gibi, bu bölüm ve kursun geri kalanında pandas da pd olarak içe aktarılmıştır.
Bu egzersiz
Python ile Veri Gizliliği ve Anonimleştirme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Print the absolute frequencies of each unique value
print(____)