Crimes-gegevens met `flexmix`
Tellingdata kom je overal tegen, van het aantal producten dat klanten in een winkel kopen tot het aantal interacties dat een groep gebruikers op Twitter heeft. Waardevolle informatie kunnen halen uit subpopulaties met vergelijkbaar gedrag is cruciaal voor veel toepassingen. Poisson-mixturemodellen (PMM) zijn een handige manier om tellingdata te clusteren.
De doelen van deze les zijn: (1) de gegevensset verkennen, (2) PMM toepassen en met een statistisch criterium het aantal clusters kiezen, (3) de parameters van het model analyseren en (4) laten zien hoe de communities worden gegroepeerd afhankelijk van het criminaliteitsniveau.
Deze oefening maakt deel uit van de cursus
Mixture Models in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Check the dimension
___(crimes)
# Check with glimpse
___(crimes)
# Transform into a matrix, without community
matrix_crimes <- crimes %>%
select(-___) %>%
___()
# Check the first values
___(matrix_crimes)