1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Eksploracyjna analiza danych w Pythonie

Connected

Exercise

Sprawdzanie nierównowagi klas

Ankieta Kaggle Survey 2022 zbiera informacje na temat pochodzenia, preferowanych technologii i stosowanych technik wśród specjalistów ds. danych. Ze względu na dużą liczbę i zróżnicowany profil respondentów jest uważana za rzetelne odzwierciedlenie aktualnego stanu branży data science.

Po przeanalizowaniu stanowisk pracy i dopasowaniu ich kategorii do ramki danych salaries możesz zobaczyć następujące proporcje kategorii zawodowych w ankiecie Kaggle:

Kategoria zawodowa Częstość względna
Data Science 0.281236
Data Analytics 0.224231
Other 0.214609
Managerial 0.121300
Machine Learning 0.083248
Data Engineering 0.075375

Traktując wyniki ankiety Kaggle jako populację, sprawdź, czy ramka danych salaries jest reprezentatywna – porównaj częstości względne kategorii zawodowych.

Instrukcje

100 XP
  • Wyświetl częstość względną kolumny "Job_Category" z ramki danych salaries.