1. Learn
  2. /
  3. Курси
  4. /
  5. Exploratory Data Analysis у Python

Connected

вправа

Перевірка дисбалансу класів

Опитування Kaggle 2022 містить інформацію про бекграунд фахівців з даних, їхні улюблені технології та методики. Його вважають точним відображенням ситуації в галузі завдяки великій кількості відповідей і профілю респондентів.

Проаналізувавши назви посад і віднісши їх до категорій, що відповідають нашому датафрейму salaries, ви бачите таке співвідношення категорій посад в опитуванні Kaggle:

Категорія посади Відносна частота
Data Science 0.281236
Data Analytics 0.224231
Other 0.214609
Managerial 0.121300
Machine Learning 0.083248
Data Engineering 0.075375

Розглядаючи результати опитування Kaggle як генеральну сукупність, ваше завдання — з'ясувати, чи є датафрейм salaries репрезентативним, порівнявши відносні частоти категорій посад.

Інструкції

100 XP
  • Виведіть відносну частоту для стовпця "Job_Category" з датафрейму salaries.