Memeriksa ketidakseimbangan kelas
Kaggle Survey 2022 memuat informasi tentang latar belakang data scientist, teknologi pilihan, dan teknik yang digunakan. Survei ini dipandang sebagai gambaran akurat tentang apa yang terjadi dalam data science berdasarkan jumlah dan profil responden.
Setelah meninjau jabatan pekerjaan dan mengkategorikannya agar selaras dengan DataFrame salaries, Anda dapat melihat proporsi kategori pekerjaan berikut dalam survei Kaggle:
| Job Category | Relative Frequency |
|---|---|
| Data Science | 0.281236 |
| Data Analytics | 0.224231 |
| Other | 0.214609 |
| Managerial | 0.121300 |
| Machine Learning | 0.083248 |
| Data Engineering | 0.075375 |
Dengan menganggap hasil survei Kaggle sebagai populasi, tugas Anda adalah mengetahui apakah DataFrame salaries representatif dengan membandingkan frekuensi relatif kategori pekerjaan.
Latihan ini adalah bagian dari kursus
Analisis Data Eksploratif di Python
Petunjuk latihan
- Cetak frekuensi relatif kolom
"Job_Category"dari DataFramesalaries.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print the relative frequency of Job_Category
print(____)