Erste SchritteKostenlos loslegen

Prüfung auf Unausgewogenheit von Klassen

Die Kaggle-Umfrage 2022 erfasst Informationen über den Hintergrund, bevorzugte Technologien und Vorgehensweisen von Data Scientists. Sie gilt daher als verlässlicher Überblick zu aktuellen Data-Science-Trends basierend auf dem Volumen und Profil der Teilnehmenden.

Nachdem du dir die Stellenbezeichnungen angesehen und sie in Übereinstimmung mit unserem DataFrame salaries kategorisiert hast, kannst du den folgenden Anteil der Jobkategorien in der Kaggle-Umfrage erkennen:

Jobkategorie Relative Häufigkeit
Data Science 0.281236
Data Analytics 0.224231
Andere 0.214609
Managerial 0.121300
Maschinelles Lernen 0.083248
Data Engineering 0.075375

Betrachte die Ergebnisse der Kaggle-Umfrage als Grundgesamtheit und finde nun heraus, ob der DataFrame salaries repräsentativ ist, indem du die relative Häufigkeit der Jobkategorien vergleichst.

Diese Übung ist Teil des Kurses

Explorative Datenanalyse in Python

Kurs anzeigen

Anleitung zur Übung

  • Gib die relative Häufigkeit der Spalte "Job_Category" im DataFrame salaries aus.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Print the relative frequency of Job_Category
print(____)
Bearbeiten und Ausführen von Code