Exploratieve data-analyse
De eerste stap van elke data-analyse, ongeacht of die unsupervised of supervised is, is om je vertrouwd te maken met de data.
De variabelen die je eerder hebt aangemaakt, wisc.data en diagnosis, zijn nog steeds beschikbaar in je werkruimte. Verken de data om de volgende vragen te beantwoorden:
- Hoeveel observaties zitten er in deze gegevensset?
- Hoeveel variabelen/features in de data hebben de suffix
_mean? - Hoeveel van de observaties hebben een maligne diagnose?
Deze oefening maakt deel uit van de cursus
Unsupervised learning in R
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen