Individuare lo sbilanciamento delle classi
Ti stai concentrando sulla fase preliminare fondamentale del ciclo di vita del Machine Learning: Exploratory Data Analysis (EDA).
L’EDA ti permette di comprendere meglio la natura dell’insieme di dati heart_disease_df, incluse le relazioni tra le diverse variabili e i potenziali problemi da affrontare prima di passare all’addestramento del modello. Capire la distribuzione delle classi nelle tue feature — per esempio, il sesso dei pazienti — è una parte chiave dell’EDA.
Lo sbilanciamento delle classi, in cui una classe ha un numero di campioni significativamente maggiore rispetto a un’altra, può influenzare il processo di addestramento del modello, portandolo a favorire la classe maggioritaria.
Questo esercizio fa parte del corso
Machine Learning end-to-end
Istruzioni dell'esercizio
- Stampa il bilanciamento delle classi della colonna
sex.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print the sex value counts of the heart disease dataset
print(____[____].____)