Prüfung auf Unausgewogenheit von Klassen
Die Kaggle-Umfrage 2022 erfasst Informationen über den Hintergrund, bevorzugte Technologien und Vorgehensweisen von Data Scientists. Sie gilt daher als verlässlicher Überblick zu aktuellen Data-Science-Trends basierend auf dem Volumen und Profil der Teilnehmenden.
Nachdem du dir die Stellenbezeichnungen angesehen und sie in Übereinstimmung mit unserem DataFrame salaries
kategorisiert hast, kannst du den folgenden Anteil der Jobkategorien in der Kaggle-Umfrage erkennen:
Jobkategorie | Relative Häufigkeit |
---|---|
Data Science | 0.281236 |
Data Analytics | 0.224231 |
Andere | 0.214609 |
Managerial | 0.121300 |
Maschinelles Lernen | 0.083248 |
Data Engineering | 0.075375 |
Betrachte die Ergebnisse der Kaggle-Umfrage als Grundgesamtheit und finde nun heraus, ob der DataFrame salaries
repräsentativ ist, indem du die relative Häufigkeit der Jobkategorien vergleichst.
Diese Übung ist Teil des Kurses
Explorative Datenanalyse in Python
Anleitung zur Übung
- Gib die relative Häufigkeit der Spalte
"Job_Category"
im DataFramesalaries
aus.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Print the relative frequency of Job_Category
print(____)