Veri dağılımını keşfet
Bir veri kümesini gerçeğe çok yakın bir şekilde örnekleyerek anonimleştirmek istediğimizde, veriye dair alan ve istatistik bilgisine ihtiyaç duyarız. Gördüğün gibi, ilgi duyulan sütunun olasılık dağılımını bulmak kritik önemdedir.
Bu egzersizde, IBM İK veri kümesinin basitleştirilmiş bir sürümündeki business_travel sütununu keşfedeceksin.
DataFrame hr olarak ve numpy np olarak içe aktarılmıştır. Önceki bölümde söylendiği gibi, bu bölüm ve kursun geri kalanında pandas da pd olarak içe aktarılmıştır.
Bu egzersiz, kursun bir parçasıdır
Python ile Veri Gizliliği ve Anonimleştirme
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Print the absolute frequencies of each unique value
print(____)