ComeçarComece gratuitamente

Verificação de desequilíbrio de classes

A Pesquisa do Kaggle de 2022 registra informações sobre o histórico, as tecnologias preferidas e as técnicas dos cientistas de dados. É considerada uma visão precisa do que está acontecendo na ciência de dados com base no volume e no perfil dos entrevistados.

Depois de analisar os cargos e categorizá-los para alinhá-los ao nosso DataFrame salaries, você pode ver a seguinte proporção de categorias de cargos na pesquisa do Kaggle:

Categoria de trabalho Frequência relativa
Ciência de dados 0.281236
Análise de dados 0.224231
Outros 0.214609
Gerencial 0.121300
Aprendizado de máquina 0.083248
Engenharia de dados 0.075375

Pensando nos resultados da pesquisa do Kaggle como a população, sua tarefa é descobrir se o DataFrame salaries é representativo, comparando a frequência relativa das categorias de trabalho.

Este exercício faz parte do curso

Análise Exploratória de Dados em Python

Ver Curso

Instruções de exercício

  • Imprima a frequência relativa da coluna "Job_Category" do DataFrame salaries.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Print the relative frequency of Job_Category
print(____)
Editar e executar código