Verificação de desequilíbrio de classes
A Pesquisa do Kaggle de 2022 registra informações sobre o histórico, as tecnologias preferidas e as técnicas dos cientistas de dados. É considerada uma visão precisa do que está acontecendo na ciência de dados com base no volume e no perfil dos entrevistados.
Depois de analisar os cargos e categorizá-los para alinhá-los ao nosso DataFrame salaries
, você pode ver a seguinte proporção de categorias de cargos na pesquisa do Kaggle:
Categoria de trabalho | Frequência relativa |
---|---|
Ciência de dados | 0.281236 |
Análise de dados | 0.224231 |
Outros | 0.214609 |
Gerencial | 0.121300 |
Aprendizado de máquina | 0.083248 |
Engenharia de dados | 0.075375 |
Pensando nos resultados da pesquisa do Kaggle como a população, sua tarefa é descobrir se o DataFrame salaries
é representativo, comparando a frequência relativa das categorias de trabalho.
Este exercício faz parte do curso
Análise Exploratória de Dados em Python
Instruções de exercício
- Imprima a frequência relativa da coluna
"Job_Category"
do DataFramesalaries
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Print the relative frequency of Job_Category
print(____)