Klassenonbalans
In de volunteer-gegevensset wil je de variabele category_desc proberen te voorspellen met de andere features in de gegevensset. Eerst moet je weten hoe de klassendistributie (en onbalans) is voor dat label.
Welke beschrijvingen komen minder dan 50 keer voor in de volunteer-gegevensset?
Deze oefening maakt deel uit van de cursus
Preprocessing voor Machine Learning in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen