BaşlayınÜcretsiz başlayın

Sınıf dengesizliğini kontrol etme

2022 Kaggle Anketi, veri bilimcilerin geçmişleri, tercih ettikleri teknolojiler ve teknikler hakkında bilgi toplar. Katılımcı sayısı ve profili sayesinde, veri bilimi alanında neler olup bittiğine dair güvenilir bir tablo sunduğu kabul edilir.

İş unvanlarına bakıp bunları salaries DataFrame’iyle uyumlu olacak şekilde kategorize ettiğimizde, Kaggle anketindeki iş kategorilerinin aşağıdaki oranlarını görürsün:

İş Kategorisi Göreli Sıklık
Data Science 0.281236
Data Analytics 0.224231
Other 0.214609
Managerial 0.121300
Machine Learning 0.083248
Data Engineering 0.075375

Kaggle anketi sonuçlarını anakütle olarak düşünerek, görevin salaries DataFrame’inin temsili olup olmadığını iş kategorilerinin göreli sıklıklarını karşılaştırarak bulmak.

Bu egzersiz, kursun bir parçasıdır

Python ile Keşifsel Veri Analizi

Kursa Göz Atın

Egzersiz talimatları

  • salaries DataFrame’indeki "Job_Category" sütununun göreli sıklığını yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Print the relative frequency of Job_Category
print(____)
Kodu Düzenle ve Çalıştır