Encontrando desbalanceamento de classes
Você está se concentrando na fase preliminar importante do ciclo de vida de Machine Learning: Análise Exploratória de Dados (EDA).
A EDA permite entender melhor a natureza do conjunto de dados heart_disease_df, incluindo as relações entre diferentes variáveis e possíveis problemas que precisam ser tratados antes de você avançar para o treinamento do modelo. Entender a distribuição das classes nas suas variáveis — por exemplo, o sexo do paciente — é uma parte essencial da EDA.
O desbalanceamento de classes, quando uma classe tem significativamente mais amostras do que outra, pode enviesar o processo de treinamento do seu modelo, levando-o a favorecer a classe majoritária.
Este exercício faz parte do curso
Machine Learning de ponta a ponta
Instruções do exercício
- Imprima o balanceamento de classes da coluna
sex.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print the sex value counts of the heart disease dataset
print(____[____].____)