1. Apprendre
  2. /
  3. Cours
  4. /
  5. Analyse exploratoire de données en Python

Connected

Exercice

Vérifier le déséquilibre des classes

Le Kaggle Survey 2022 recueille des renseignements sur le parcours des spécialistes des données, leurs technologies et techniques préférées. Étant donné le volume et le profil des répondants, on le considère comme un reflet fidèle de ce qui se passe en science des données.

Après avoir passé en revue les titres d'emploi et fait une catégorisation pour les aligner avec notre DataFrame salaries, vous obtenez la proportion suivante de catégories d'emploi dans le sondage Kaggle :

Catégorie d'emploi Fréquence relative
Data Science 0.281236
Data Analytics 0.224231
Other 0.214609
Managerial 0.121300
Machine Learning 0.083248
Data Engineering 0.075375

En considérant les résultats du sondage Kaggle comme la population, votre tâche consiste à vérifier si le DataFrame salaries est représentatif en comparant la fréquence relative des catégories d'emploi.

Instructions

100 XP
  • Affichez la fréquence relative de la colonne "Job_Category" du DataFrame salaries.