Aan de slagGa gratis aan de slag

Class-ongelijkheid opsporen

Je richt je op de belangrijke voorbereidende fase van de Machine Learning-levenscyclus: Exploratory Data Analysis (EDA).

Met EDA krijg je beter inzicht in de aard van de gegevensset heart_disease_df, inclusief de relaties tussen verschillende variabelen en mogelijke problemen die je moet aanpakken voordat je je model gaat trainen. Inzicht in de verdeling van klassen in je features—bijvoorbeeld het geslacht van de patiënt—is een belangrijk onderdeel van EDA.

Class-ongelijkheid, waarbij één klasse aanzienlijk meer voorbeelden heeft dan een andere, kan de trainingsfase van je model vertekenen, waardoor het de meerderheidsklasse gaat bevoordelen.

Deze oefening maakt deel uit van de cursus

End-to-End Machine Learning

Cursus bekijken

Oefeninstructies

  • Print de klassenverdeling van de kolom sex.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print the sex value counts of the heart disease dataset
print(____[____].____)
Code bewerken en uitvoeren