1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Exploratory Data Analysis in Python

Connected

Cvičení

Kontrola nevyvážených tříd

Kaggle Survey 2022 zachycuje informace o zázemí datových vědců, jejich oblíbených technologiích a metodách. Díky vysokému počtu respondentů a jejich profilu je považován za přesný obraz aktuálního dění v oblasti datové vědy.

Po prozkoumání pracovních pozic a jejich přiřazení do kategorií odpovídajících DataFrame salaries vidíš v Kaggle průzkumu následující zastoupení kategorií:

Kategorie pracovní pozice Relativní frekvence
Data Science 0,281236
Data Analytics 0,224231
Other 0,214609
Managerial 0,121300
Machine Learning 0,083248
Data Engineering 0,075375

Výsledky Kaggle průzkumu považuj za reprezentaci celé populace. Tvým úkolem je zjistit, zda DataFrame salaries je reprezentativní – porovnej relativní frekvenci kategorií pracovních pozic.

Pokyny

100 XP
  • Vypiš relativní frekvenci sloupce "Job_Category" z DataFrame salaries.