Verificação de desequilíbrio de classes
A Pesquisa do Kaggle de 2022 registra informações sobre o histórico, as tecnologias preferidas e as técnicas dos cientistas de dados. É considerada uma visão precisa do que está acontecendo na ciência de dados com base no volume e no perfil dos entrevistados.
Depois de analisar os cargos e categorizá-los para alinhá-los ao nosso DataFrame salaries, você pode ver a seguinte proporção de categorias de cargos na pesquisa do Kaggle:
| Categoria de trabalho | Frequência relativa |
|---|---|
| Ciência de dados | 0.281236 |
| Análise de dados | 0.224231 |
| Outros | 0.214609 |
| Gerencial | 0.121300 |
| Aprendizado de máquina (machine learning) | 0.083248 |
| Engenharia de dados | 0.075375 |
Pensando nos resultados da pesquisa do Kaggle como a população, sua tarefa é descobrir se o DataFrame salaries é representativo, comparando a frequência relativa das categorias de trabalho.
Este exercício faz parte do curso
Análise Exploratória de Dados em Python
Instruções do exercício
- Imprima a frequência relativa da coluna
"Job_Category"do DataFramesalaries.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print the relative frequency of Job_Category
print(____)