Prüfung auf Unausgewogenheit von Klassen
Die Kaggle-Umfrage 2022 erfasst Informationen über den Hintergrund, bevorzugte Technologien und Vorgehensweisen von Data Scientists. Sie gilt daher als verlässlicher Überblick zu aktuellen Data-Science-Trends basierend auf dem Volumen und Profil der Teilnehmenden.
Nachdem du dir die Stellenbezeichnungen angesehen und sie in Übereinstimmung mit unserem DataFrame salaries kategorisiert hast, kannst du den folgenden Anteil der Jobkategorien in der Kaggle-Umfrage erkennen:
| Jobkategorie | Relative Häufigkeit |
|---|---|
| Data Science | 0.281236 |
| Data Analytics | 0.224231 |
| Other | 0.214609 |
| Managerial | 0.121300 |
| Machine Learning | 0.083248 |
| Data Engineering | 0.075375 |
Betrachte die Ergebnisse der Kaggle-Umfrage als Grundgesamtheit und finde nun heraus, ob der DataFrame salaries repräsentativ ist, indem du die relative Häufigkeit der Jobkategorien vergleichst.
Diese Übung ist Teil des Kurses
<Kurs>Explorative Datenanalyse in Python</Kurs>Übungsanweisungen
- Gib die relative Häufigkeit der Spalte
"Job_Category"im DataFramesalariesaus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Print the relative frequency of Job_Category
print(____)