Verificare lo squilibrio tra classi
Il Kaggle Survey 2022 raccoglie informazioni sul background dei data scientist, sulle tecnologie preferite e sulle tecniche utilizzate. È considerato un’istantanea accurata di ciò che accade nel mondo della data science grazie al volume e al profilo dei rispondenti.
Dopo aver esaminato i titoli di lavoro e li averli categorizzati per allinearli con il nostro DataFrame salaries, puoi vedere la seguente proporzione di categorie professionali nel sondaggio Kaggle:
| Job Category | Relative Frequency |
|---|---|
| Data Science | 0.281236 |
| Data Analytics | 0.224231 |
| Other | 0.214609 |
| Managerial | 0.121300 |
| Machine Learning | 0.083248 |
| Data Engineering | 0.075375 |
Considerando i risultati del sondaggio Kaggle come la popolazione, il tuo compito è verificare se il DataFrame salaries è rappresentativo confrontando la frequenza relativa delle categorie professionali.
Questo esercizio fa parte del corso
Analisi esplorativa dei dati in Python
Istruzioni dell'esercizio
- Stampa la frequenza relativa della colonna
"Job_Category"dal DataFramesalaries.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print the relative frequency of Job_Category
print(____)