Sınıf dengesizliğini kontrol etme
2022 Kaggle Anketi, veri bilimcilerin geçmişleri, tercih ettikleri teknolojiler ve teknikler hakkında bilgi toplar. Katılımcı sayısı ve profili sayesinde, veri bilimi alanında neler olup bittiğine dair güvenilir bir tablo sunduğu kabul edilir.
İş unvanlarına bakıp bunları salaries DataFrame’iyle uyumlu olacak şekilde kategorize ettiğimizde, Kaggle anketindeki iş kategorilerinin aşağıdaki oranlarını görürsün:
| İş Kategorisi | Göreli Sıklık |
|---|---|
| Data Science | 0.281236 |
| Data Analytics | 0.224231 |
| Other | 0.214609 |
| Managerial | 0.121300 |
| Machine Learning | 0.083248 |
| Data Engineering | 0.075375 |
Kaggle anketi sonuçlarını anakütle olarak düşünerek, görevin salaries DataFrame’inin temsili olup olmadığını iş kategorilerinin göreli sıklıklarını karşılaştırarak bulmak.
Bu egzersiz, kursun bir parçasıdır
Python ile Keşifsel Veri Analizi
Egzersiz talimatları
salariesDataFrame’indeki"Job_Category"sütununun göreli sıklığını yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Print the relative frequency of Job_Category
print(____)