Sınıf dengesizliğini kontrol etme
2022 Kaggle Anketi, veri bilimcilerin geçmişleri, tercih ettikleri teknolojiler ve teknikler hakkında bilgi toplar. Katılımcı sayısı ve profili sayesinde, veri bilimi alanında neler olup bittiğine dair güvenilir bir tablo sunduğu kabul edilir.
İş unvanlarına bakıp bunları salaries DataFrame’iyle uyumlu olacak şekilde kategorize ettiğimizde, Kaggle anketindeki iş kategorilerinin aşağıdaki oranlarını görürsün:
| İş Kategorisi | Göreli Sıklık |
|---|---|
| Data Science | 0.281236 |
| Data Analytics | 0.224231 |
| Other | 0.214609 |
| Managerial | 0.121300 |
| Machine Learning | 0.083248 |
| Data Engineering | 0.075375 |
Kaggle anketi sonuçlarını anakütle olarak düşünerek, görevin salaries DataFrame’inin temsili olup olmadığını iş kategorilerinin göreli sıklıklarını karşılaştırarak bulmak.
Bu egzersiz
Python ile Keşifsel Veri Analizi
kursunun bir parçasıdırEgzersiz talimatları
salariesDataFrame’indeki"Job_Category"sütununun göreli sıklığını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Print the relative frequency of Job_Category
print(____)