Gegevensset met handgeschreven cijfers
De gegevensset met handgeschreven cijfers heeft ongeveer 160 records voor elk cijfer van 0 tot en met 9. Elk record bestaat uit 256 kolommen met waarden 0 of 1 en stelt een afbeelding voor van 16x16 pixels.
Later in de cursus gebruik je deze data om met flexmix de clusters te vinden die de cijfers verklaren. Nu is het doel om vertrouwd te raken met gegevenssets die je kunt modelleren met mengmodellen op basis van de Bernoulli-verdeling.
Het object data bevat de observaties van slechts twee cijfers uit de oorspronkelijke gegevensset.
Deze oefening maakt deel uit van de cursus
Mixture Models in R
Oefeninstructies
- Gebruik
dim()om de afmetingen van het data frame te controleren. - Gebruik
glimpse()om de data te bekijken. Dit is een handige functie om elke kolom te inspecteren, zeker als het er veel zijn. - Gebruik de functie
show_digit()om de rijen 50 en 100 om te zetten naar een afbeelding.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Dimension
dim(___)
# Apply glimpse to the data
___(data)
# Digit in row 50
show_digit(data[___,])
# Digit in row 100
show_digit(data[___,])