1. Learn
  2. /
  3. Cursuri
  4. /
  5. Analiza exploratorie a datelor în Python

Connected

exercițiu

Verificarea dezechilibrului de clase

Sondajul Kaggle din 2022 colectează informații despre pregătirea profesioniștilor în știința datelor, tehnologiile preferate și tehnicile utilizate. Este considerat o imagine fidelă a tendințelor din domeniu, datorită volumului și profilului respondenților.

După ce ai analizat titlurile de job și le-ai clasificat pentru a se alinia cu DataFrame-ul salaries, poți observa următoarea proporție a categoriilor de job în sondajul Kaggle:

Categorie de job Frecvență relativă
Data Science 0,281236
Data Analytics 0,224231
Other 0,214609
Managerial 0,121300
Machine Learning 0,083248
Data Engineering 0,075375

Considerând rezultatele sondajului Kaggle drept populație de referință, sarcina ta este să verifici dacă DataFrame-ul salaries este reprezentativ, comparând frecvența relativă a categoriilor de job.

Instrucțiuni

100 XP
  • Afișează frecvența relativă a coloanei "Job_Category" din DataFrame-ul salaries.