IniziaInizia gratis

Verificare lo squilibrio tra classi

Il Kaggle Survey 2022 raccoglie informazioni sul background dei data scientist, sulle tecnologie preferite e sulle tecniche utilizzate. È considerato un’istantanea accurata di ciò che accade nel mondo della data science grazie al volume e al profilo dei rispondenti.

Dopo aver esaminato i titoli di lavoro e li averli categorizzati per allinearli con il nostro DataFrame salaries, puoi vedere la seguente proporzione di categorie professionali nel sondaggio Kaggle:

Job Category Relative Frequency
Data Science 0.281236
Data Analytics 0.224231
Other 0.214609
Managerial 0.121300
Machine Learning 0.083248
Data Engineering 0.075375

Considerando i risultati del sondaggio Kaggle come la popolazione, il tuo compito è verificare se il DataFrame salaries è rappresentativo confrontando la frequenza relativa delle categorie professionali.

Questo esercizio fa parte del corso

Analisi esplorativa dei dati in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Stampa la frequenza relativa della colonna "Job_Category" dal DataFrame salaries.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Print the relative frequency of Job_Category
print(____)
Modifica ed esegui il codice